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Gegenstand der Erfindung sind neuen Semapho- 
rine, die sich durch eine besondere Domanenstruktur 
auszeichnen und deren Derivate, Nukleinsauren (DNA, 
RNA, cDNA), die fOr diese Semaphorine kodieren und 
deren Derivate sowie die Verwendung derselben. 
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(immunmodulierende Semaphorine). Die erfindungs- 
gemaBen Semaphorine werden als Semaphorine vom 
Typ L (SemaL) bezeichnet. Sie enthalten ein N-termina- 
les Signalpeptid, eine charakteristische Sema-Domane 
und im C-terminalen Bereich des Proteins eine Immun- 
globulin-ahnliche DomAne und eine hydrophobe 
Domane, die eine potentielle Transmembrandomane 
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Beschreibung 

Humanes Semaphorin L(H-SemaL) und korrespondierende Semaphorine in anderen Spezies. 

Gegenstand der Erfindung sind neue Semaphorine, die sich durch eine besondere Domanenstruktur auszeichnen 
5 und deren Derivate, Nukleinsauren (DNA, RNA, cDNA), die fur diese Semaphorine kodieren und deren Derivate sowie 
die Herstellung und Verwendung derselben. 

Semaphorine wurden erstmais von Koldokin {Kolodkin et al. (1993) Cell 75:1389-1399} als Mitglieder einer konser- 
vierten Genfamilie beschrieben. 

Inzwischen wurden die Gene bzw. Teile der Gene weiterer Semaphorine kloniert und teilweise charakterisiert. Bis- 
io her waren insgesamt 5 humane (H-Sema III, H-Sema V, H-Sema IV, H-SemaB und H-SemaE) {Koldokin et al. (1993); 
Roche et al. (1996) Onkogene 12:1289-1297; Sekido et al. (1996) Proc. Natl. Acad. Sci. USA 93:4120-4125; Xiang et 
al. (1996) Genomics 32:39-48; Hall et al. (1996) Proc. Natl. Acad. Sci. USA 39:11780-11785; Yamada et al. (1997) 
(GenBank Zuordnungs-Nr. AB000220)}, 8 rnurine (Gene der Maus; M-Sema A bis M-SemaH) (Puschel et al. (1995) 
Neuron 14:941-948; Messerschmidt et al. (1995) Neuron 14:949-959; Inigaki et al. (1995) FEBS Letters 370:269-272; 
is Adams et al. (1996) Mech. Dev. 57:33-45; Christensen et al. (1996) (Genbank Zuordnungs-Nr. Z80941, Z93948)}, 5 
galline (Huhn) (Collapsin-1 bis -5) {Luo et al. (1993); Luo et al. (1995) Neuron 14:1 131-1 140}, und Gene von Ratte (R- 
Sema III) {Giger et al. (1996) J. Comp. Neurol. 375:378-392}, Zebrafisch, Insekten (Fruchtfliege (Drosophila melanoga- 
ster: D-Sema I und D-Sema II), Kafer (Tribolium confusum: T-Sema I), Grasshupfer (Schistocerca americana: G-Sema 
I)) {Kolodkin et al. (1993)}, und Nematoden (C.elegans: Ce-Sema) {Roy et al. (1994) (GenBank Zuordnungs-Nr. 
20 U 15667)} bekannt. Weiterhin besitzen zwei Poxviren (Vaccinia (ORF-A39) und Variola (ORFA39-homolog)) {Kolodkin 
et al. (1993)} sowie der Alcela phine Herpesvirus Typ 1 (AHV-1) (AHV-Sema) {Ensser und Fleckenstein (1995) Gen. 
Virol. 76:1063-1067} zu Semaphorinen homologe Gene. 

Einen Uberblick uber die bisher identifizierten Semaphorine in verschiedenen Spezies gibt Tabelle 1. In Tabelle 1 
sind die Namen der Semaphorine (Spalte 1), die verwendeten Synonyme (Spalte 2), die Spezies aus der das jeweilige 
25 Semaphorin isoliert wurde (Sparte 3) sowie, soweit bekannt, Daten zur Domanenstruktur des kodierten Proteins und 
zur chromosomafen Lokalisation (Spalte 4 in Tabelle 1), die Zuordnungsnummer unter der die Sequenz des Gens in 
Gendatenbanken, z.B. in einer EST (expressed sequence tags) Datenbank, EMBL (European Molecular Biology Labo- 
ratory, Heidelberg) Oder NCBI (National Center for Biotechnology Information, Maryland, USA) gespeichert ist und die 
entsprechende Referenz unter der diese Daten publiziert wurden (Spalte 5 in Tabelle 1), angegeben. 

30 Alle Genprodukte (kodierte Semaphorine) der bisher bekanrrten Semaphorin Gene weisen ein N-terminales 
Signalpeptid auf, an dessen C-terminalem Ende sich eine charakteristische Sema-Domane mit einer Lange von etwa 
450 bis 500 Aminosauren befindet Innerhalb der Sema-Domane finden sich stark konservierte Aminosfiuremotive und 
eine Anzahl hochkonservierter Cysteinreste. Die Genprodukte (Semaphorine) unterscheiden sich in den auf die Sema- 
Domane folgenden C-terminalen Sequenzen, die aus einer Oder mehreren Domanen aufgebaut sind. Sie weisen bei- 
35 spielsweise in diesen C-terminalen Aminosauresequenzen Trans membrandomanen (TM), Immunoglobulin-ahnliche 
Domanen (Ig) (konstanter Teil des Immunoglobulins), zytoplasmatische Sequenzen (CP), Prozessierungssignale (P) 
(bei spielsweise mit der Konsensussequenz (RXR), wobei R fur die Aminosaure Arginin und X fOr eine beliebige Ami- 
nosaure steht) und/oder hydrophile C-Termini (HPC) auf. Auf der Basis der unterschied lichen Domanenstruktur im C- 
Terminus lassen sich die bisher bekannten Semaphorine in 5 verschiedene Untergruppen einteilen (I bis V): 

40 

I Sezerniert, ohne weitere Domane (z.B. ORF-A49) 

II Ig Sezerniert (ohne Transmembrandomane) (z.B. AHV-Sema) 

ill Ig, TM. CP Membranverankert mit zytoplasmatischer Sequenz (z.B. CD100) 

IV Ig, (P), HPCSezerniert mit hydrophilem C-Terminus (z.B. H-Sema III, M-SemaD, Collapsin-1) 

45 V Ig, TM, CP Membranverankert mit C-terminalem 7 Thrombospondin-Motiv (z.B. M-SemaF und G) 

Ein Rezeptor oder extrazelluiarer Ligand fur Semaphorine wurde bisher nicht beschrieben. Im Zusamrnenhang mit 
Semaphorin-vermitteHen Effekten wurden intrazelluiare, heterotrimere GTP-bindende Proteinkomplexe beschrieben. 
Als ein Bestandteil dieser Proteinkomplexe wurden bei Huhnern sogenannte CRMP-Proteine (Collapsin response 
so mediator protein) identifiziert, welche vermutlich Bestandteil der Semaphorin-induzierten intrazelluldren Signalkaskade 
sind (Goshima et al. (1995) Nature 376: 509-514). Das CRMP62 beispielsweise besitz: Homologie zu unc-33, einem 
fur das gerichtete Axonwachstum essentiellen Nemaloden-Protein. Ein humanes Protein mit 98% Aminosaure-ldentitat 
zu CRMP62 ist ebenfalls bekannt (Hamajima et al. (1996) Gene 180: 157-163. In Ratten wurden ebenfalls mehrere 
CRMP-verwandte Gene beschrieben (Wang etal. (1996) Neurosci. 16: 6197-6207. 

55 Die sezernierten Oder transmembrahen Semaphorine vermitteln repulsive Signale ftir wachsende Nervenknospen. 
Sie spielen eine Rolle bei der Entwicklung des zentralen Nervensystems (ZNS) und werden vor allem in Muskel- und 
Nervengewebe exprimiert (Koldokin et al. (1993); Luo et al. (1993) Cell 75:217-227. 

Au6er im ZNS konnte eine deutliche Expression von M-SemaG auch auf Zellen des lymphatischen und hamato- 
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poetischen Systems beobachtet werden, im Gegensatz zum nahe verwandten M-SemaF {Furuyima et al. (1996) J. 
Biol. Chem. 271 : 33376-33381). 

Kurzlich wurden zwei weitere humane Semaphorine identlfiziert H-Sema IV und H-Sema V und zwar in einer 
Region auf Chromosom 3p21.3, deren Deletion mit verschiedenen Fonnen von Bronchial karzinomen assoziiert ist H- 
5 Sema IV {Roche et al. (1 996), Xiang et al. (1 996), Sekido et al. (1 996)} ist auf Aminosaureebene etwa zu 50% identisch 
mit M-SemaE, wahrend H-Sema V {Sekido et al. (1996)} das direkte Homolog zu M-Sema-A ist (86% Aminosaureiden- 
titat). Da diese Gene (H-Sema IV und V) im Rahmen von DNA-Sequenzierungs-Projekten der deletierten 3p21 .3 Loci 
gefunden wurden, ist die komplexe Intron-Exon-Struktur dieser beiden Gene bekannt. Die beiden Gene werden in ver- 
schiedenen neuronalen und nicht neuronalen Geweben exprimiert. 
io Ebenfalls erst vor kurzem wurde das zelluiare Oberfiachenmolekul CD 100 (human), exprimiert und induziert auf 
aktivierten T-Zellen, als Semaphorin identrfiziert (ebenfalls in Tabelle 1 aufgefOhrt). Es unterstotzt die Interaktion mit B- 
Zeilen uber den Rezeptor CD40 und den entsprechenden Liganden CD40L. CD100 ist ein membranverankertes Gly- 
koprotein-Dimer von 150kd (Kilodalton). Es wurde eine Assoziation des intrazytoplasmatischen C-Terminus von CD 100 
mit einer noch unbekannten Kinase beschrieben {Hall et al. (1996)}. Damit ist CD 100 das erste und bisher einzige 
is Semaphorin, dessen Expression in Zellen des Immunsystems nachgewiesen werden konnte. 

Unter der Fragestellung "Transformierende Gene von Rhadinoviren" wurde das komplette Genom des Alcelaphi- 
nen Herpesvirus Typ 1 (AHV-1) kloniert und sequenziert {Ensser et al. (1995)}. AHV-1 ist der Erreger des bOsartigen 
Katarrhalfiebers, einer mit einem lymphoproliferativen Syndrom einhergehenden, meistfatalen Erkrankung verschiede- 
ner Wiederkauer. Bei der Analyse wurde an einem Ende des viralen Genoms ein offener Leserahmen mit entfernter, 
20 aber signifikanter Homologie zu einem Gen von Vacciniavirus (ORF-A39 entspricht VAC-A39 in Ensser et al. (1995)) J. 
Gen. Virol. 76:1063-1067), welches der Genfamilie der Semaphorine zugerechnet wurde, gefunden. Wahrend das 
AHV-1 Semaphorin (AHV-Sema) eine gut konservierte Semaphorin-Struktur besitzt, sind die Poxvirus-Gene (ORF-A39 
und ORF-A39-homo!og, siehe Tabelle 1) C-terminal verkurzt, d.h. bei ihnen ist die konservierte Sema-Domane nur 
unvollstandig vorhanden. 

25 Ein Datenbankvergleich des gefundenen AHV-Sema mit dbEST (EST (expressed sequence tags)-Datenbank (db)) 
lieferte jeweils 2 EST-Sequenzen von 2 unabhangigen cDNA-Klonen aus humaner Plazenta (Zuordnungsnummern 
H02902, H03806 (Klon 151129), Zuordnungsnummern R33439 und R33537 (Klon 135941)). Diese wiesen deutlich 
hdhere Homologie zum AHV-1 Semaphorin auf, als zu den bis dahin beschriebenen neuronalen Semaphorinen. 

Gegenstand der vorliegenden Erfindung sind Semaphorine mit einer neuen, bisher nicht bekannten und nicht zu 
30 erwartenden Domanenstruktur, denen eine biochemische Funktion im Immunsystem zukommt (immunmodulierende 
Semaphorine). Die erfindungsgemaBen Semaphorine werden als Semaphorine vom Typ L (SemaL) bezeichnet Sie 
enthalten ein N-terminales Signalpeptid, eine charakteristische Sema-Domane und im C-terminalen Bereich des Pro- 
teins eine Immunglobulinahnliche Domane und eine hydrophobe Domane, die eine potentielle Transmembrandomane 
darstelft 

35 Die Aminosaure-Sequenz des Signalpeptids kann weniger als 70, vorzugsweise weniger als 60 Aminosauren und 
mehr als 20, vorzugsweise mehr als 30 Aminosauren aufweisen, besonders bevorzugt ist eine Lange von etwa 40 bis 
50 Aminosauren. In einer speziellen Ausfuhrung storm der Erfindung hat das Signalpeptid eine Lange von 44 Amino- 
sauren, d.h. zwischen den Aminosauren 44 und 45 befindet sich eine Spaltstelle fur eine Sign alp eptidase. 

Die Sema-Domane kann eine Lange von 300 bis 700 oder mehr, vorzugsweise von etwa 400 bis 600 Aminosauren 
40 aufweisen. Bevorzugt sind Sema-Domanen mit einer Lange von 450 bis 550 Aminosauren, vorzugsweise von etwa 500 
Aminosauren. In einer besonderen Ausfuhrungsform der Erfindung schlieBt sich die Sema-Domane an das Signalpep- 
tid an, wobei sich die Sema-Domane vorzugsweise bis zur Aminosaure 545 erstreckt. 

Die Immunglobulin-ahnliche Domane kann eine Lange von etwa 30 bis 110 Oder mehr Aminosauren aufweisen, 
bevorzugt sind Langen zwischen 50 und 90, besonders bevorzugt etwa 70 Aminosauren. 

45 Die Transmembrandomane kann eine Lange von etwa 10 bis 35, vorzugsweise von etwa 15 bis 30, besonders 
bevorzugt von etwa 20 bis 25 Aminosauren aufweisen. 

Gegenstand der Erfindung sind Semaphorine vom Typ L aus verschieden Spezies, insbesondere aus Wirbeltieren, 
beispielsweise aus VOgeln und/oder Fischen, vorzugsweise aus Saugetieren, beispielsweise aus Primaten, Ratte, Kan- 
ninchen, Hund, Katze, Schaf, Ziege, Kuh, Pferd, Schwein, besonders bevorzugt aus Mensch und Maus. Gegenstand 
so der Erfindung sind auch entsprechende Semaphorine aus Mikroorganismen, insbesondere aus pathogenen Mikroor- 
ganismen, beispielsweise aus Bakterien, Hefen und/oder Viren, z.B. aus Retroviren, insbesondere aus humanpathoge- 
nen Mikroorganismen. 

Eine AusfGhrungsform der Erfindung ist ein entsprechendes humanes Semaphorin (H-SemaL), das ein Signalpep- 
tid, eine Sema-Domane, eine Immunglobulin-ahnliche Domane und eine Transmembrandomane aufweist Eine spezi- 
55 elle Ausfuhrungsform ist das Semaphorin, das durch die Aminosauresequenz gemaB Tabelle 4 gegeben ist. 

Eine weitere AusfQhrungsform der Erfindung sind korrespondierende Semaphorine in anderen Spezies, die im 
Bereich der Sema-Domane eine Aminosaureidentitat grOBer als 40 %. vorzugsweise grOBer 50 %. besonders bevor- 
zugt grOBer 60 % im Bezug auf die Sema-Domane von H-SemaL (Aminosauren 45 bis 545 der Sequenz in Tabelle 4) 



3 




EP 0 892 047 A2 



aufweisen. Aus nSher verwandten Spezies (z.B. Primaten. Maus) konnendie korrespondierenden Semaphorine durch- 
aus AminosSureidentitaten grOBer als 70%, vorzugsweise grdBer als 80 %, besonders bevorzugt grOBer als 90 % auf- 
weisen. Prozentuale Homologien konnen beispielsweise mit dem Programm GAP (GCG ProgramnvPaket. Genetic 
Computer Group (1991)) bestimmt bzw. berechnet werden. 

, E,n ® d ® rarti 9e AusfOhrungsform der Erfindung ist ein korrespondierendes Semaphorin der Maus (murines Sema- 

( Y 0nn Beispl0lswe| s 0 enthait dieses die partielle Aminosauresequenz gemaB Tabelle 5 (murines Sema- 

pnorin (M-SemaL)). 

Die Erfindung betrifft auch korrespondierende Semaphorine, die eine Aminosaureidentitat (Qber die GesamBange 
der Aminosauresequenz des Protein betrachtet) von nur etwa 15 bis 20% bei wenig verwandten Spezies (phylogene- 
tisch weit voneinander entfernt), vorzugsweise 25 bis 30%, besonders bevorzugt 35 bis 40 % Oder eine hahere Iderrtitat 
im Bezug auf die gesamte Aminosauresequenz von H-SemaL gemaB Tabelle 4 aufweisen. 

Die Gene, die fOr Semaphorine von Typ L kodieren. weisen eine komplexe Exon-Intron-Struktur auf. Diese Gene 
kannen beispielsweise zwischen 10 und 20 Exons, vorzugsweise etwa 11 bis 18, besonders bevorzugt 12 bis 16 Exons 
und eine entsprechende Anzahl von Introns aufweisen. Sie kdnnen aber auch die gleiche Anzahl Exons und Introns 
aufweisen wie das Gen von H-SemaL (13 Oder 15 Exons, vorzugsweise 14 Exons). Eine besondere Ausfuhmngsform 
. , er u , rflndun 9 1 betrifft das Gen von H-SemaL. Dieses Gen hat vorzugsweise eine Lange von 8888 bis 1 0000 Oder mehr 
Nukleotiden. Das humane Semaphorin-Gen enthait vorzugsweise die Nukleotid-Sequenz. die in Tabelle 1 4 gegeben ist 
°. er d '® NuWeotidsequenz, die in der Datenbank GenBank® unter der Zugangsnummer AF030697 hinterlegt wurde 
Diese Nukleotidsequenzen enthalten mindestens 13 Introns. Dariiber hinaus weist das humane Semaphorin-Gen am 
5 -Ends einen zusatzlichen Sequenzbereich auf. Dieser Bereich enthait gegebenfalls weitere kodierende und nichko- 
aierende Sequenzen, z.B. ein Oder zwei weitere Introns bzw. Exons.. 

Die Versuche zur chromosomalen Lokalisation des humanen Semaphorins vom Typ L ergaben, daB das entspre- 
Nsiert 8 G8n 30 P0Siti ° n 1 5q22 ‘ 3 ' 23 'okalisieri ist Entsprechend wurde das Gen fOr M-SemaL an Position 9A3.3-B loka- 



Als Folge der komplexen Intron-Exon Struktur kann das Primartranskript der Semaphorin mRNA unterschiedlich 
gespliced werden, wodurch unterschiedliche Splicevarianten der Semaphorine entstehen. Die aus diesen Splicevarian- 
ten translatierten Proteine sind Derivate der erfindungsgemaBen Semaphorine. Sie entsprechen in ihrer Aminosaure- 
sequenz und auch weitgehend in ihrer Domanenstruktur den beschriebenen, erfindungsgemaBen Semaphorinen vom 
lyp L, sind jedoch gegebenenfalls gegenuber diesen verkurzt. Beispielsweise kOnnen Splicevarianten, denen die 
30 Transmembrandomane ganz Oder teilweise fehlt, gebildet werden. Ein Semaphorin- Derivat, welches keine Oder keine 
vollstandige Transmembrandomane. aber ein Signalpeptid enthait, kann sezerniert werden und auf diese Weise auBer- 
halb der Zelle lokal Oder auch uber grOBere Entfernungen wirken, beispielsweise auf andere Zellen. Bne andere Spli- 
cevariante kann beispielsweise keine Sequenz mehr enthalten, die fur ein Signalpeptid kodiert und gegebenfalls auch 
„ ^ ein ® „® < 2. uenz c ; dle fQr eine f0r hydrophobe Aminosauresequenz kodiert. die eine potentielle Transmembrandomane 
aarstellt. Eine Folge wSre, daB dieses Semaphorin- Derivat weder in die Membran eingebaut, noch sezerniert wird (es 
sei enn uber sekretorische Vesikel). Ein solches Semaphorin-Derivat kann an intrazelluiaren Prozessen beispieis- 
weise an Signafe'ansduktionsprozessen beteiligt sein. Auf diese Weise kdnnen mit dem gieichen Grundmolekule (Sem- 
ap orme vom yp L) und den davon abgeleiteten Derivaten (beispielsweise Splicevarianten) vielfailtige intra- und 
extrazellulSre Prozesse regufiert und/oder aufeinander abgestimmt werden. 

Eine besondere Ausfuhrungsform der Erfindung betrifft Semaphorin- Derivate, die sich von den erfindungs- 
gemaBen Semaphonnen vom Typ L ableiten. die aber keine oder keine vollstandige Transmembrandomane enthalten. 

Eine weitere AusfOhrungsform der Erfindung betrifft Semaphorin-Derivate, die sich von den erfindungsgemaBen 
Semaphorinen vom Typ L ableiten, die aber kein Signalpeptid enthalten. 

Das Signalpeptid kann auch posttranslational abgespalten werden. Dadurch wird ein membranstandiges (mit TM- 
45 omane) oder ein sezerniertes (Splicevariante ohne TM-Domane) Semaphorin-Derivat mit verkOrzter Domanenstruk- 
tur gebildet. Ein auf diese Weise posttranslational prozessiertes Semaphorin-Derivat enthait nur noch Sema-Domane 
Ig-Domane und gegebenfalls Transmembrandomane. Eine Signalpeptidschnittstelle kann beispielsweise direkt am 
Ende des Signalpeptids I.egen, sie kann z.B. 40 bis 50 Aminosauren oder weiter vom Aminoterminus entfernt lokalisiert 



Ein verkurztes" (d.h. weniger Domanen enthaltendes) Semaphorin L-Derivat ist von anderen Semaphorinen, die 
sich mcht von den Semaphorinen vom Typ L ableiten, dadurch zu unterscheiden, daB es eine sehr groBe (> 90 %) Ami- 
nosaureidentitat oder eine identische Aminosauresequenz mit den Semaphorinen vom Typ L in den vorhandenen 



Die erfindungsgemaBen Semaphorine konnen auch in anderer Weise posttranslational modifiziert sein. Beispiels- 
w ®*s e konnen sie ein-, zwei-, drei-, vier- funf, sechs-, sieben-, acht-, neun- zehn- oder mehrfach glykosyliert (N- 
und/oder O-glykosyliert) vorliegen. Die Aminosauresequenzen der Semaphorine kdnnen dann ebenso viele Oder mehr 
Konsensussequenzen fOr potentielle Glykosylierungsstellen aufweisen, vorzugsweise funf derartige Stellen. Eine Aus- 
fuhrungsform der Erfindung betrifft Semaphorine, bei denen die Glykosylierungsstellen an Positionen lokalisiert sind 
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10 



15 



20 



25 



30 



35 



40 



SO 



die den Positionen 105. 157, 258, 330 und 602 der H-SemaL AminosSuresequenz entsprechen (Tabelle 4). 

die ^bst^e^n^erKHTioHr 0 e ^ n ^ orr ^* ihrer phosphorylierten Derivate vorliegen. Semaphorine kOnnen 
f,v PnF* r unterschiedlicher Kinasen sein, beispielsweise kOnnen die Aminosauresequenzen Konsensussequenzen 

len der Ser^nriS j^ r0ain Wnase und/oder Kreatin aufweisen. Weiterhin kOnnen die AminosauSequen- 

Q konsensussequenzen for potentielle Myristylierungsstellen aufweisen. An diesen Stellen kOnnen 
entsprechende Semaphorin-Derivate mit Myristinsaure verestert sein. 

..nH/^r e M in !! Un9S9ema J 3en Sema P horine vom T yp L und deren Derivate kOnnen in Form von Monomeren. Dimeren 
mXufrir«n »LT V ^ 98n ' beis P i6lsweise ^nnen zwei oder mehr Semaphorine bzw. deren Derivate Ober inter- 
rusbSin U e " mite,nander verbun den sein. DarOber hinaus kOnnen sich intramolekulare Disuifidbrucken 

einereeitetrn d sImInhn n9S9em r Be ? ^ maph ° rine ^ weiterhin Fusionsproteine. Ein solches Fusionsprotein enthait 
* " e -^M h, Semaphore vom Typ L oder Teile desselben und dartiber hinaus ein weiteres Peptid oder Protein bzw 

SZLTSrx? od rr o,eine b r j ei,e derse,ben k6nnen zb ^ 

3 Jag flu-Tag). die z.B. zur Aufrem.gung der Fusionsproteine verwendet werden kOnnen. oder solche, die zur Mar- 
vate ^ Fus,dns P rote,ne verwendet w erden kOnnen, z.B. GFP (green fluorescent protein), sein. Beispiele fur Deri- 
Suen Se | T aph0dne t vo ™ ^ L sind z - B - Ourch die in den Beispielen beschriebenen Konstrukte^egeben Die 

rS rZ SS2S22SS, ST ^ 71 “* » < de, AnnoM'o- 

fur ITZ Ge9ens,and de ' Frfindung sind Nukleinsaure-Sequenzen, vorzugsweise DNA- und RNA-Sequenzen die 

Chenden re d nT 9 rt 98m f 6en t , Se r a f h0nne V ° m TyP L und/oder deren Derivate kodieren, beispielsweisedie entspre- 

DeTvaS ?rLteHer e ^M C A'f pMA^ liCeVarianten mRNAl *• dazU korres P°^dierenden cDNAs sowie deren 
Derivate, z a Salze der DNA bzw. RNA Derivate im Sinne der Erfindungen sind Sequenzen Oder Teile davon die z B 

SSfoSJ SSSI S?S dan rST Und ^ dl ' 6 jewei "' 9en Anfo rderungen angepaBt weiden, beispielsweise 
c ° ene (Z - & Promotorse quenzen, Terminatorsequenzen), cDNAs Oder Chimare dersel- 

ben, Konstrukte for Expressionen und Klonierungen und deren Salze. 

QhfUn if^ rrn b ® ,rifft di ® 9enomischen Sequenzen (Gene) der Semaphorine vom Typ L Die Erfindung 
S^ce^-S^u^'zen Ex ° n ' Sequenzen und Senregulatorische Sequenzen. beispielsweise Promotor-. Enhancer- und 

P Ein Geg , enSt ! nd d jf ser AusfOhrungsform ist das Gen von H-SemaL bzw. dessen Derivate. Ein Gegenstand der 
Erfinduno kt T G ^' d,e Nu ^ e ° tldseqijerlz . die in Tabelle 14 gegeben ist. enthait Ein weiterer Gegenstand der 

die «- D «“"=“ k M d» Zug.ngsn™ 

Ein weiterer Gegenstand dieser AusfOhrungsform ist das Gen von M-SemaL bzw. dessen Derivate 
Ein weiterer Gegenstand der Erfindung ist die cDNA von H-SemaL oder deren Derivate (z B Teile der cDNA) Eine 
iSt die CDNA V ° n H ' SemaL 9emaB der NuWeotidsequenz Tn Tabeile 2 Bn weitere" 

AFOSOS^hinterlert^Kn" 9 "* T TO* S? ^ SemaU die in der Datenbank GenBank® unter der Zugangsnummer 
Te?e derselten ^ Ge 9enstand der Erfindung sind auch die zu diesen cDNAs korrespondierenden mRNAs bzw. 

Ein weiterer Gegenstand der Erfindung ist die cDNA von M-SemaL Oder deren Derivate (z. B. Teile der cDNA) Eine 

dto dSe ' St dlS Partie " e cDNA ' Sequenz von M ' SemaL gemSB Tabelle 3 sowie cDNA-Sequenzen, 

^ n DN t' SeqUenZ enthalten - Eine weitere AusfOhrungsform der Erfindung betrifft die cDNA von M- 

Sd auchrite^H b n^A G tl Bank Untef d6r Zu9an9Snummer AF030699 hinterlegt ist. Gegenstand der Erfindung 

sind auch die zu diesen cDNAs korrespondierenden mRNAs bzw. Teile derselben. 9 

Die Erfindung beinhaltet auch Allele und/oder individuelle Auspragungsformen der Gene/mRNAs/cDNAs die sich 
den D hierbeSChriebenen Semaphorin-Sequenzen unterscheiden und fo7ein iSSSSSl rf^nur 
geringfugig verandertes Protein (Abweichung in der Aminosaure-Sequenz Weiner oder gleich 10%) kodieren (weiteres 

S fU ; D r a,e) ' W6i * ere BeiSpie,e die Derivate ** durcb d *e in den Beispillen tSSSS 

SfdTr ‘^notowTpi S w Kdnstrulde sind in den Tabellen 7 bis 14 dargestellt und kOnnen unter Berucksichti- 

Qung aer Annotation fur Plasmids interpretiert werden. 

0^;^? G !u e u S,ar ^ Erfindun 9 sind Plasmide, die DNA, die for die Semaphorine des Typs L bzw. deren 

eine^oM^lrDNA r PlaSn "' de k6nnen beis P ielswe ise Plasmide mit hohen Replikationsraten sein. die for 
eine Ampiifikation der DNA, z.B. in E. coli geeignet sind. 

Eine spezielle AusfOhrungsform sind Expressionsplasmide, mit denen die Semaphorine bzw Teile davon oder 

E^resston^r ' n P ‘ ) ° l ^ ry ° ten und/oder eukaryoten Expressions-Systemen exprimiert weiden kOnnen. Es sind sowohl 
Expressionsplasmide die konshtutive als auch solche, die induzierbare Promotoren enthalten, geeignet 

L " “* U "“ ren " H * a *" U " S «” «• «- S.m aptol n e ^ T^p 

Beispielsweise kOnnen diese NuWeinsauren, z B. DNA oder RNA auf chemischem Weg synthetisiert weiden. Insbeson- 
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dere kdnnen diese NukleinsSuren, z. B. die entsprechenden Gene oder cDNAs bzw. Teile derselben mit der PCR unter 
Verwendung von spezifischen Primern und geeignetem Ausgangsmaterial als Template (z. B. cDNA aus einem geeig- 
neten Gewebe Oder genomische DNA) amplifiziert werden. 

Ein konkretes Verfahren zur Herstellung von Semophorin L cDNA bzw. des H SemaL Gens ist in den Beispielen 
5 beschrieben. 

Die Erfindung betrifft auch Verfahren zur Herstellung der Semaphorine vom Typ L Beispielsweise kann ein Sema- 
phorin L oder ein Derivat desselben dadurch hergesteilt werden, daB eine entsprechende Nukleinsaure-Sequenz, die 
fQr ein Semaphorin vom Typ L oder ein Derivat desselben kodiert, in einen Expressionsvektor kloniert und mit diesem 
rekombinanten Vektor eine geeignete Zelle transformiert wird. Es kdnnen beispielsweise prokaryote Oder eukaryote 
io Zellen verwendet werden. Die Semaphorine vom Typ L oder deren Derivate kdnnen gegebenenfalls auch auf chemi- 
schem Weg hergesteilt werden. 

Daruber hinaus kdnnen die Semaphorine vom Typ L bzw. deren Derivate als Fusionsproteine exprimiert werden, 
beispielsweise mit Proteinen oder Peptiden, die einen Nachweis des exprimierten Fusionsproteins erlauben, z.B. als 
Fusionsprotein mit GFP (green fluorescent protein). Die Semaphorine kdnnen auch als Fusionsproteine mit einem, 
is zwei, drei oder mehreren Epitop-Tags, beispielsweise mit Myc- und/oder His-(6xHistidin) und/oder flu-Tags exprimiert 
werden. Entsprechend kdnnen Plasmide verwendet Oder hergesteilt werden. die DNA-Sequenzen enthalten, die fur 
diese Fusionsproteine kodieren. Beispielsweise kdnnen Semaphorin kodierende Sequenzen in Plasmide kloniert wer- 
den, die DNA-Sequenzen enthalten, die fur GFP und/oder Epitop-Tags, z.B. Myc-Tag, His-Tag, flu-Tag kodieren. Kon- 
krete Beispiele dafur sind durch die Beispiele und die in den Tabellen aufgefuhrten Sequenzen ggfs. unter 
20 Zuhilfenahme der Annotation zu den Plasmiden gegeben. 

Ein weiterer Gegenstand der Erfindung sind Antikdrper, die spezifisch die Semaphorine vom Typ L, deren Derivate 
oder Teile davon binden bzw. erkennen. Dies konnen beispielsweise polyklonale oder monoklonale Antikdrper, die z.B. 
in Maus, Kaninchen, Ziege, Schaf, Huhn usw. hergesteilt werden kdnnen, sein. 

Eine besondere Ausfuhrungsforrn dieses Gegenstandes der Erfindung sind Antikdrper, die gegen die Epitope die 
25 den Aminosauresequenzen von Position 179 bis 378 bzw. 480 bis 666 der H-SemaL Sequenz gemaB Tabelle 4 ent- 
sprechen, gerichtet sind. Die Erfindung betrifft auch ein Verfahren zur Herstellung von spezifischen Anti-Semaphorin L 
AntikCrpem, wobei fur die Herstellung Arrtigene verwendet werden, die genannten Epitope enthalten. 

Die Erfindung betrifft auch Verfahren zur Herstellung der Antikdrper, vorzugsweise wird dazu ein Fusionsprotein. 
bestehend aus einem charakteristischen Semaphorin Epitop und einem Epilop-Tag, welches fur die anschlieBende 
30 Aufreinigung des rekombinanten Fusionsproteins verwendet werden kann. Das aufgereinigte Fusionsprotein kann 
anschlieBend fur die Immunisierung verwendet werden. Zur Herstellung des rekombinanten Fusionsproteins wird ein 
entsprechender rekombinanter Expressionsvektor hergesteilt und mit diesem eine geeignete Zelle transformiert. Aus 
dieser Zelle kann das rekombinante Fusionsprotein isoliert werden. Die Durchfuhrung kann beispielsweise wie in Bei- 
spiel 8 beschrieben erfolgen. 

35 Diese Antikdrper kdnnen beispielsweise zur Aufreinigung der entsprechenden Semaphorine, z.B. von H-SemaL 
und dessen Derivaten z.B. uber Affinitatssaulen oder zum immunologischen Nachweis der Proteine, z.B. im ELISA, im 
Western-Blot und/oder in der Immunhistochemie verwendet werden. Die Antikdrper kdnnen auch zur Analyse der 
Expression von H-SemaL, z. B. in verschiedenen Zelltypen bzw. Zellinien verwendet werden. 

Die cDNA von H-SemaL hat eine Lange von 2636 Nukleotiden (Tabelle 2). Das Genprodukt der H-SemaL-cDNA 
<o hat eine LSnge von etwa 666 Ammosauren (Tabelle 4) und weist die typische Domanenstruktur eines Semaphorins 
vom Typ L auf. Das Genprodukt weist ein N-terminales Signalpeptid (AminosSuren 1 bis 44), Sema-Domane (Amino- 
sflure 45 bis ungefahr AminosSure 545) und Ig (Immunglobulin)-Domane (etwa AminosSuren 550 bis 620) sowie am C- 
terminalen Ende eine hydrophobe Aminosauresequenz auf, die eine potentielle Transmembrandomane darstellt. Diese 
Domanen-Struktur wurde bisher fur Semaphorine noch nie beschrieben. Es handelt sich um ein membranassoziiertes, 
<5 wahrscheinlich an der Zelloberfiache lokalisiertes Glykoprotein einer neuen Untergruppe. Aufgrund dieser bisher nicht 
bekannten Domanenstruktur kdnnen die Semaphorine nun in VI Untergruppen eingeteilt werden: 

I Sezerniert, ohne weitere Domane (z.B. ORF-A49) 

II Ig Sezerniert (ohne Transmembrandomane) (z.B. AHV-Sema) 

50 HI Ig, TM, CP Membranverankert mit zytoplasmatischer Sequenz (z.B. CD100) 

IV Ig, (P), HPCSezerniert mit hydrophilem C-Terminus (z.B. H-Sema III, M-SemaD, Collapsin-1) 

V Ig, TM, CP Membranverankert mit C-terminalem 7 Thrombospondin-Motiv (z.B. M-Sema-F und G) 

VI Ig, TM Membranverankert (z.B. H-SemaL, M-SemaL) 

55 Die nichtglykosylierte, nichtprozessierte Form von H-SemaL hat ein errechnetes Molekulargwicht von etwa 74,8 kD 
(74823 Dalton) (berechnet mit PeptideSort, GCG-Programm-Paket). Der Isoelektrische Punkt berechnet sich zu pH= 
7.56. 

Eine mdgliche Signalpeptid-Schnittstelle liegt zwischen den Aminosauren 44 und 45 (Tabelle 3; berechnet mit SignalP 
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(http7/www.cbs.dtu.dk/services/Signal P), einem auf neuronaten Netzwerken basierenden Programm zur Analyse von 
Signalsequenzen {Nielsen H. et al. (1997) Protein Engineering 10:1-6}). Dies ergibt fur das prozessierte Protein (ohne 
Signalpeptid) ein Molekulargewicht (MW) von 70,3 kD (70323 Datton) und einen Isoelektrischen Punkt von pH=7.01. 

Die genomische Struktur ist ebenfalls weitgehend geWSrt. Das H-SemaL-Gen weist 13 Oder 15 Oder mehr Exons, 
5 vorzugsweise 14 Exons und 12 Oder 14 Introns, vorzugsweise 13 Introns auf. Aufgrund dieser komplexen Exon-lntron- 
Struktur sind unterschiediiche Splice- Varianten mfiglich. Die mRNA des transkribierten H-SemaL-Gens lindet sich im 
Northern-Blot vor allem in Placenta, Keimdrusen, Thymus und Milz. Es wurde keine mRNA in neuronalem Gewebe 
oder in Muskelgewebe nachgewiesen. Ein Hinweis auf eine spezifisch regulierte Expression in Endothelzellen liegt vor. 

Durch alternatives Splicing kOnnen auch Formen von H-SemaL mit intrazytoplasmatischen Sequenzen entstehen, 
io die eine Rolle in der intrazelluiaren Signaltransduktion spielen, ahnlich wie z.B. bei GDI 00. 

Ebenfalls mOglich wSren durch alternatives Splicing entstehende, sezernierte Formen von H-SemaL. analog zum vira- 
len AHV-Sema. 

Nukleotid- und Aminosauresequenzanalysen wurden mit Hilfedes GGG Programm- Pakets (Genetics Computer Group 
(1991) Program manual for the GCG package, version 7, 575 Science Drive, Wisconsin, USA 53711), FASTA (Pearson 
is und Lipman (1988) Proc. Natl. Acad. Sci. 85, 2444-2448) und BLAST-Program (Gish und States (1993) Nat. Genet.3, 
266-272; Altschul et al. (1990) J. Mol. Biol. 215, 403-410) durchgefuhrt. Diese Programme wurden auch fur Sequenz- 
vergleiche mit GenBank (Version 102.0) und Swiss Prof (Version 34.0) verwendet. 

Posttranslationale Modifikationen wie Glykosylierung und Myristylierung von H-SemaL sind ebenfalls mdglich. 
Konsens us- Sequenzen fur N-Glykosylierungsstellen wurden mit Hilfe des Programms Prosite (GGG Programm- Paket) 
20 an den Positionen 1 05, 1 57, 258, 330, 602 der Aminosauresequenz von H-SemaL (gemaB Tabelle 4) gefunden, solche 
fur Myristylierung an den Positionen 114, 139. 271 , 498, 499, 502, 654 (Konsensus-Sequenz: G~(E, D, R, K, H, P, F, Y, 
W) x (S, T, A,G, C, N)~(P)). Daruber hinaus enthait die Aminosauresequenz von H-SemaL mehrere Konsensus- 
Sequenzen fur potentielle Phosphorylierungsstellen durch unterschiediiche Kinasen. Deshalb kann davon ausgegan- 
gen werden, daB H-SemaL das Substrat unterschiedlicher Kinasen sein kann, z.B. Phosphorylierungsstellen fur Krea- 
25 tin-Kinase 2, Protein- Kinase C und Tyrosin-Kinase. 

Vorausgesagte Kreatin -Kinase 2-Phosphorylierungs-StelIen (Konsensussequenz Ck2: (S,T)x2(D,E)) (Prosite, 
GCG) an den Positionen 119, 131, 173, 338, 419, 481 der Aminosauresequenz. Vorausgesagte Protein-Kinase-C- 
Phosphorylierungs-Stellen (Konsensussequenz PkC: (S,T)x(R,K)) (Prosite, GCG) an den Positionen 107, 115, 190, 
296, 350, 431, 524, 576 der Aminosauresequenz. Vorausgesagte Tyrosin-Kinase-Phosphorylierungs-Stelle (Konsen- 
30 sussequenz: (R,K)x{2,3)(D.E)x{2,3}Y) (Prosite GCG) an Position 205 der Aminosauresequenz. 

Die Konsensussequenzen sind im Einbuchstabencode fflr Aminosauren angegeben. 

Ein fOr fntegrine charakteristisches "RGD"-Motiv (Arginin-Glycin-Asparaginsaure) findet sich an Position 267. 

Die Glykosylierungsstellen sind gut konserviert zwischen viralem AHV-Sema, H-SemaL und (soweit bekanrrt) M- 
SemaL. 

35 Eine Di- Oder Multimerisierung von H-SemaL ist mdglich und wurde bei anderen Semaphorinen wie CD 100 
beschrieben {Hall et al. (1996)}. Das CD100 Molekul ist ebenfalls ein membra nverankertes Glykoprotein-Dimer von 
150kd. CD100 ist jedoch nicht nahe verwandt mit dem erfindungsgemaBen humanen Semaphorin (H-SemaL). 

Die partielle cDNA-Sequenz von M-SemaL hat eine Lange von 1 195 Nukleotiden. Diese Sequenz kodiert fur ein 
Protein mit 394 Aminosauren. Diese 394 Aminosauren entsprechen den Aminosauren 1 bis 396 von H-SemaL. Das 
40 Signalpeptid im M-SemaL ersteckt sich uber die Aminosauren 1 bis 44 (genau wie im H-SemaL). Die Sema-Domane 
beginnt bei der Aminosaure 45 und erstreckt sich bis zum Ende bzw. wahrscheinlich Gber das Ende der Sequenz 
gemaB Tabelle 4 hinaus. 

Multiple Alignments wurden mit Hilfe des Programms Clustal W (Thompson et al. (1994)) durchgefuhrt Diese Ali- 
gnments wurden manuell weiterbearbeitet mit Hilfe von SEAVIEW (Galtier et al. (1996) Comput Appl. Biosci 12, 543- 
45 548). Die phylogenetischen Entfernungen wurden mit Clustal W (Thompson et al. (1994)) bestimmt. 

Ein Vergleich der Proteinsequenzen der bekannten und der neuen Semaphorine und eine phylogenetische Ana- 
lyse dieser Sequenzen zeigt, daB sich die Gene entsprechend ihrer phylogenetischen Verwandschalt einteilen lassen. 
Hier flieBt naturlich die C-terminale Domanenstruktur der entsprechenden Semaphorin-Subtypen als entscheidender 
Faktor mit ein, weshalb Semaphorine der gleichen Untergruppen in der Regel auch phylogenetisch naher verwandt 
so sind, als Semaphorine unterschiedlicher Untergruppen. EinfluB hat auch, aus welcher Spezies das Semaphorin isoliert 
wurde, d.h. ob die entsprechenden Spezies phylogenetisch nahe miteinander verwandt sind oder nicht. 

Eine phylogenetische Analyse (vergl. Figur 3) der bekannten Semaphorin Aminosauresequenzen (vollstandige 
Sequenzen und/oder Teilsequenzen, wobei die Aminosauresequenzen fur H-SemaL und M-SemaL gemaB den Tabel- 
ien 4 und 5 verwendet wurden, fur alle anderen Sequenzen, die unter den Zugangsnummern gespeicherten Sequen- 
55 zen bzw. die von diesen Sequenzen abgeleiteten Aminosauresequenzen)) mitt els des Programms CLUSTALW 
{Thompson J.D. et al. (1994) Nucleic Acids Res. 22:4673-4680} zeigt, daB die Aminosauresequenzen von H-SemaL 
und M-SemaL phylogenetisch nahe miteinander verwandt sind und eine eigene phylogenetische Gruppe bilden. H- 
SemaL und M-SemaL wiederum sind phylogenetisch am nachsten verwandt mit AHV-Sema und Vac-A39. Sie sind 
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untereinander deutlich naher verwandt, als mit irgendeinem anderen bisher bekannten Semaphorin. Die Analyse zeigt 
weiterhin, daB auch andere Semaphorine phylogenetisch nahe miteinander verwandt sind und eigene Gruppen inner* 
halb der Semaphorine bilden. Beispielsweise fallen die Semaphorine, die sezerniert werden, z.B. H*Sema III, IV, V, und 
E in eine phylogenetische Gruppe. 2u dieser Subfamilie gehOren auch deren Homologe in anderen Spezies, wShrend 
5 das humane (trans membrane) CD 100 mit dem entsprechenden Maus-Homologen (M-Sema G2) und mit ColIapsin-4 
in eine phylogenetische Gruppe lallt. 

Im Bezug auf die gesamten AminosSuresequenzen liegen die beobachteten Homologien innerhalb der phylogene- 
tischen Gruppen zwischen etwa 90% und 80% Aminosaureidentitat im Bezug auf sehr nahe verwandte Gene wie z.B* 
H- und M-SemaE oder -Ill/D und etwas weniger als 40% bei wenig verwandten Genen der Semaphorine. Innerhalb der 
io Sema-Domane liegt die beobachtete Aminosaureidentitat um einige Prozerrt hOher, und durch ihren groBen Anteil am 
Gesamtprotein (50-80% des Proteins gehOren zur Sema-Domane) der Aminosauresequenz beinfluBt diese wesentlich 
die Gesamtidentitat. 

H*SemaL ist, uber das Gesamtprotein berechnet, zu 46% identisch mrt AHV-Sema, wird dagegen die Sema-Domane 
allein betrachtet, dann betragt die Aminosaureidentitat 53%. Dies ist hOher als z.B. zwischen den verwandten M- 
15 SemaB und -C (37% Identitat im Bezug auf das Gesamtprotein, 43% Identitat im Bezug auf die Sema-Domane), ahn- 
lich wie M-SemaA und *E (43% Gesamtprotein, 53% Sema-Domane). Die Aminosaureidentitat zwischen der partiellen 
M-SemaL Sequenz (Tabelle 6) und H-SemaL (Tabelle 5) liegt im Bereich der Sema-Domane bei 93%, so daB davon 
ausgegangen werden kann, daB es sich um das entsprechend homologe Gen der Maus handelt 
Korrespondierende Semaphorine zu H-SemaL und M-SemaL in anderen Spezies kOnnen innerhalb der Sema-Domane 
20 eine Aminosaureidentitat grOBer als 40% im Bezug auf H-SemaL aufweisen. Bei den nahe verwandten Wirbeltieren 
(Sauger, VOgel) kOnnen sogar Aminosaureidentitaten uber 70% angetroffen werden. 

Es handelt sich um eine neue Subfamilie von Semaphorinen mit grOBerer Aminosaureidentitat zu dem viralen AHV- 
Sema als zu den bisher bekannten humanen bzw. murinen Semaphorinen, und mit einer fur humane Semaphorine bis- 
her nicht bekannten C-terminalen Struktur. Diese neuen Semaphorine (Mitglieder der Subfamilie) zeichnen sich 
25 dadurch aus, daB sie aufgrund ihrer Domanen -struktur in die Untergruppe IV fallen und/oder die gleiche phylogeneti- 
sche Gruppe fallen wie H-SemaL und M-SemaL und/oder im Bezug auf die gesamte Aminosauresequenz zu H-SemaL 
eine Aminosaureidentitat von mindestens 30 bis 40 %, vorzugsweise 50 bis 60 %, besonders bevorzugt 70 bis 80 % 
oder eine grOBere Identitat aufweisen und/oder im Bezug auf die Sema-Domane eine Aminosaureidentitat mit H- 
SemaL von mindestens 70 %, vorzugsweise grOBer 80 %, besonders bevorzugt grOBer 90 % aufweisen. 

30 Den Semaphorinen vom Typ L kommt auch eine andersartige biochemische Funktion zu. Eine neue Funktion die- 

ser Semaphorine liegt in der Modulation des Immunsystems. 

Das nachste Verwandte von H-SemaL ist das virale AHV-Semaphorin (AHV-Sema). Dieses ist von ahnlicher 
GrOBe, besitzt aber im Gegensatz zum H-SemaL keine Transmembrandomane. Das AHV-Sema wird vermutlich von 
virusinfizierten Zellen sezerniert, um den H-SemaL aquivalenten Rezeptor (Semaphorin von Typ L im Streifengnu) im 
35 naturlichen Wirt (Streifengnu) zu blockieren, und so dem Angriff des Immunsystems zu entgehen. Ferner ist eine Funk- 
tion als repulsives Agens (Chemorepellent) fur Zellen des Immunsystems denkbar. 

Die biochemische Funktion der neuen Semaphorine vom Typ L und deren Derivate ist als generell immunmodulie- 
rend und/oder entzundungsmodulierend anzusehen. Einerseits kOnnen sie 

40 A) als die Immunantwort hemmende Molekule entweder lokal, z.B. als Transmembranprotein an der Oberfiache 
von Zellen oder auch uber grOBere Entfernungen, z.B. wenn sie durch Prozessierung (z.B. Proteasen) oder alter- 
natives Splicing sezerniert werden, z.B. durch Diffusion im Gewebe, ihre Wirkung als Chemorepellent und/oder 
Immunsuppressivum entfaiten. 

Beispielsweise kann die Expression dieser neuen Semaphorine vom Typ L z.B. an der Oberfiache der Zellen der 
45 GefaBendothelien das Leukozyten- Attachment und deren Migration durch die GefOBwand verhindern. Den neuen 
Semaphorinen kann eine Rolle bei der Aufrechterhaltung von Schrankenwirkungen, z.B. zur Verhindung von Infek- 
tionen in besonders "wichtigen" oder exponierten Organen, beispielsweise zur Aufrechterhaltung der Blut-Hirn- 
Schranke, des Plazentarkreislaufs und/oder anderen immunologisch priviligierten Orten (z.B. Pancreas-1 nseln) 
und/oder beim Schutz vor Autoimmunerkrankungen zukommen. Daruber hinaus kOnnen die neuen Semaphorine 
so und/oder ihre Derivate in verschiedenen Geweben auch an repulsiven Signalen, beispielsweise fur Zellen des 
Immunsystems (z.B. Leukozyten) als Schutz gegen versehentliche Aktivierung von Abwehrmechanismen beteiligt 
sein. 

B) Weiterhin kOnnen den neuen Semaphorinen und/oder deren Derivaten Funktionen als akzessorische Molekule 
55 zukommen. An der Zelloberfiache exprimiert kOnnen sie beispielsweise an der Interaktion mit Zellen des Immun- 
systems im Rahmen der Aktivierung von Abwehrmechanismen z. B. bei Virusinfektionen beteiligt sein. 

Dadurch ergeben sich mehrere VerwendungsmOglichkeiten fur die neuen Sempahorine vom Typ L und deren Deri- 
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vaten sowie den fur diese Proteins kodierenden Nukleinsauren. 

Funktion A): Es handelt sich um ein immunsuppressives und/oder entzOndungshemmendes Prinzip: Zahlreiche 
potentielle Anwendungsmflglichkeilen liegen in den Bereichen Organtransplantation. EntzOndungstherapie, Immunthe- 
rapie und Gentherapie. 

5 Beispielsweise kflnnen mit Hilfe der Semaphorin-kodierenden DNA Oder Derivaten derselben nichthumane trans- 

gene Tiere hergestellt werden. 

Eine Anwendungsmflglichkeit dieser Tiere liegt in der Hemmung der TransplantatabstoBung in transgenen Modellen for 
Organtransplantationen. Beispielsweise kflnnen transgene, gegen AbstoBung geschOtzte tierische Organe fur Xeno- 
transplantationen hergestellt werden. Dies sollte z.B. auch zusammen mit anderen Transgenen (z.B. Komplementreau- 
io latoren wie DAF Oder CD59) mflglich sein. 

Eine weitere Anwendung liegt in der Herstellung von nicht-humanen Knock-out Tieren. beispielsweise von Knock-out 
Mausen(„Labora1ory Protocols for Gene-Targeting", Torres and Kuhn (1997) Oxford University Press. ISBN 0-19- 
963677-X): Durch Knock-out des Mausgens M-SemaL kflnnen z.B. weitere Funktionen des Gens aufgefunden werden. 
Sie stellen auch potentielle Modellsysteme fur entzundliche Erkrankungen dar, falls die MSuse ohne Semaphorin-Gen 
is lebensfShig sind. Sollte M-SemaL fur die Immunmodulation wichtig sein, so sind vermehrt solche MSuse zu erwarten. 
Weiterhin kflnnen nicht-humane Knock-in-Tiere. beispielsweise Mfluse, hergestellt werden. Dabei wird z B M-SemaL 
durch normales/verandertes H-SemaL Oder verandertes M-SemaL (z.B. Integration der neuen Semaphorin-Subtypen 
urrter der Kontrolle von konstitutiven und/oder induzierbaren Promotoren) ersetzt. Solche Tiere kflnnen z B fur die 
Suche nach weiteren Funktionen der neuen Semaphorine. z.B. Funktionen des humanen Gens Oder Derivaten dieser 
so Gene dienen oder zur Identifizierung und Charakterisierung von immunmodulierenden Wirkstoffen benutzt werden. 

Verwendung von z. B. Nukleinsauren, die for Semaphorine vom Typ L Oder Derivate derselben kodieren, zur Her- 
stellung von z.B. rekombinanten Immunsuppressiven, anderen Iflslichen Proteinen oder Peptiden die sich von der Ami- 
nosauresequenz der Semaphorine vom Typ U z.B. Von H-SemaL oder den entsprechenden Nukleinsauren, z.B 
Genen ableiten. In ahnlicher Weise kflnnen auch Agonisten mit struktureller Ahnlichkeit hergestellt werden. Diese 
25 immunsuppressiven Wirkstoffe/Agonisten kflnnen bei Autoimmunerkrankungen und entzOndlichen Erkrankungen 
und/oder Organtransplantationen eingesetzt werden. 

Gentherapie mit Semaphorinen vom Typ L, z.B. mit Nukleinsauren, die fur H-SemaL oder deren Derivate kodieren 
z. B. mitt els viraler oder nichtviraler Methoden. Einsatz bei Autoimmunerkrankungen und entzOndlichen Erkrankungen, 

der Transduktion von Organen sowie vor/wahrend/nach Transplantationen zur Verhinderung der Transplantatabsto- 
30 Bung. 

Insbesondere kflnnen die neuen Semaphorine und/oder die fOr diese Semaphorine kodierenden Nukleinsauren 
und Derivate derselben, insbesondere H-SemaL, fur H-SemaL kodierende DNA und Derivate derselben in einem Ver- 
fahren zum Screening von Wirkstoffen, insbesondere zur Identifizierung und Charakterisierung von immunnodulieren- 
den Wirkstoffen, eingesetzt werden. 

35 Funktion B): H-SemaL 1st ein akzessorisches Molekul, das an der Zelloberliache exprimiert wird und an der Inter- 
aktion mit Zellen, z.B. des Immunsystems, z.B. als akzessorisches Molekul in der Aktivierung von Signalwegen, betei- 
igt ist Ein vi rales Gen bzw. das Genprodukt eines viralen oder anderen pathogenen Gens z.B. mikrobilogischen 
Ursprunges kOnnte z.B. als kompetitiver Inhibitor dieses akzessorischen Molekuls wirken. Eine Anwendung fur die 
neuen Semaphorine liegt bei dieser Funktion ebenfalls im Bereich der Organtransplantation, Entzundungstherapie Irn- 
io muntherapie und/oder Gentherapie. ’ 

Beispielsweise kflnnen die neuen Semaphorine in einem Verfahren zum Screening von aritagonistischen Wirkstoffen 
bzw. Inhibitoren verwendet werden. Auf diese Weise identifizierte Wirkstoffe kflnnen dann z.B. zur Blockade des Sem- 
aphorin' Rezeptors eingesetzt werden. LOsliche und/oder sezemierte H-SemaL Antagonisten bzw. Inhibitoren kflnnen 
beispielsweise chemische Substanzen oder die neuen Semaphorine bzw. Derivate derselben selbst sein (z.B 
is Teile/verkOrzte Formen derselben, beispielsweise ohne Membrandomane oder als Ig-Fusionsproteine oder von diesen 
abgeleitete Peptide, die geeignet sind, den korrespondierenden Rezeptor zu blockieren). Auf diese Weise identifizierte. 
spezifische Antagonisten und/oder Inhibitoren kflnnen beispielsweise kompetitiv wirken und bei der Hemmung der 
AbstoBung z.B. in transgenen Modellen fur Organtransplantationen und bei Autoimmunerkrankungen, entzOndlichen 
Erkrankungen und Organtransplantationen eingesetzt werden. Nukleinsauren, z. B. DNA, die fOr die neuen Semapho- 
so rine kodieren bzw. deren mil Hilfe von molekularbiologischen Methoden erzeugte Derivate kflnnen beispielsweise for 
die Herstellung mchthumaner, transgener Tiere verwendet werden. Eine Clberexpression von H-SemaL kann in diesen 
transgenen Tieren zu vermehrter Anfailigkeit fur Autoimmunerkrankungen und/oder entzOndlichen Erkrankungen fOh- 
rea Solche transgenen Tiere eignen sich damit zum Screening von neuen, spezifischen. immunmodulierenden Wirk- 
stoffen. 

55 Solche Nukleinsauren kennen ebenso fur die Herstellung von nicht-humanen Knock-out Tieren, beispielsweise Knock- 
out Mausen. bei denen das Mausgen M-SemaL ausgeschaltet wird, verwendet werden. Solche Knock-out Tiere kon- 
nen fur die Suche nach weiteren biochemischen Funktionen des Gens eingesetzt werden. Sie stellen auch potentielle 
Modellsysteme fur entzundliche Erkrankungen dar, falls die Mause ohne das M-SemaL Gen lebensfahig sind 
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Diese DNA kann ebenso zur Herstellung von nicht-humanen Knock-in Tieren, beispielsweise Mausen verwendet war- 
den. Dabei wird das M-SemaL-Gen durch ein verSndertes M-SemaL Gen/cDNA Oder ein gegebenfalls ver&ndertes, 
z.B. mutiertes Semaphorin Typ L Gen/cDNA einer anderen Spezies, z.B. von H-SemaL ersetzt, Solche transgenen 
Tiere kOnnen fur die Suche nach weiteren Funktionen der erfindungsgemaBen Semaphorine verwendet werden. 

5 Die Erfindung betrifft auch die Verwendung der Semaphorine vom Typ L und deren Derivate, sowie der fur diese 

Proteine kodierenden Nukieinsauren, z. B. Gene/cDNAs und deren Derivate und/oder mit Hilfe dieser Semaphorine 
identifizierter Wirkstoffe zur Herstellung von Arzneimitteln. Beispielsweise kOnnen Arzneimittel hergestelit werden, die 
in der Gentherapie angewendet werden kfinnen und die Agonisten und/oder Antagonisten der Expression der Sema- 
phorine vom Typ L, beispielsweise von H-SemaL, enthalten. Dazu kOnnen z. B. virale und/oder nichtvirale Methoden 
io verwendet werden. Diese Arzneimittel kdnnen z.B. bei Autoimmunerkrankungen und entzundliche Erkrankungen, 
Organtransplantationen vor und/oder wahrend und/oder nach der Transplantation zur Verhinderung der AbstoBung ein- 
gesetzt werden. 

Die fur die neuen Semaphorine kodierenden Nukieinsauren, z. B. Gene, cDNAs und deren Derivate kOnnen auch als 
Hilfsmittel in der Molekularbiologie eingesetzt werden. 

is Daruberhinaus kbnnen die neuen Semaphorine, insbesondere H-SemaL und Nukieinsauren, z. B. Gene/cDNAs der- 
selben in Verfahren zum Screening neuer Wirkstoffe eingesetzt werden. Modifizierte Proteine und/oder Peptide, die 
sich z. B. von H-SemaL und/oder M-SemaL ableiten, kOnnen zur Suche nach dem entsprechenden Rezeptor und/oder 
dessen Antagonisten bzw. Agonist in funktionellen Tests, beispielsweise mittels Expressionskonstrukten von H-SemaL 
und Homologen eingesetzt werden. 

20 Die Erfindung betrifft auch die Verwendung eines Semaphoring vom Typ L Oder einer Nukleinsaure-Sequenz, die 
fur ein Semaphorin vom Typ L kodiert in einem Verfahren zur Identifizierung von pharmakologischen Wirkstcrffen, ins- 
besondere von immunmodulierenden Wirkstoffen. 

Die Erfindung betrifft auch Verfahren zur Identifizierung von Wirkstofen, wobei ein Semaphorin vomTyp L Oder ein 
Derivat derselben bzw. eine Nukleinsaure-Sequenz, die fur ein Semaphorin vom Typ L kodiert Oder ein Derivat dersel- 
25 ben eingesetzt wird, um pharmakologische Wirkstoffe, z. B. immunmodulierende Wirkstoffe zu identifizieren. Beispiels- 
weise betrifft die Erfindung ein Verfahren, bei dem ein Semaphorin vom Typ L unter definierten Bedingungen mit einem 
zu urrtersuchenden Wirkstoff inkubiert wird und parallel ein zwefler Ansatz ohne den zu untersuchenden Wirkstoff, aber 
unter ansonsten gleichen Bedingungen durchgefQhrt wird und dann die inhibierende bzw. aktivierende Wirkung des zu 
untersuchenden Wirkstoffs bestimmt wird. 

30 Beispielsweise betrifft die Erfindung auch Verfahren zur Identifizierung von Wirkstoffen, wobei eine Nukleinsaure- 
Sequenz, die fur ein Semaphorin vom Typ L kodiert Oder ein Derivat derselben urrter definierten Bedingungen in 
Gegenwart eines zu untersuchenden Wirkstoffs exprimiert wird und das AusmaB der Expression bestimmt wird. Gege- 
benenfalls kdnnen auch in einem solchen Verfahren zwei Oder mehrere Ansdtze parallel unter gleichen Bedingungen 
durchgefuhrt werden, wobei die Ansatze aber unterschiedliche Mengen des zu untersuchenden Wirkstoffs enthalten. 
35 Beispielsweise kann der zu untersuchende Wirkstoff die Transkription und/oder die Translation inhibieren Oder aktivie- 
ren. 

Das Semaphorin vom Typ L kann wie seine viralen Homologen an das neu beschriebene Rezeptormolekul VESPR 
(Comeau et al, (1998) Immunity, Vol. 8, 473-482) binden und kann vermutlich in Monozyten eine Induktion von Zell- 
AdhasionsmdekQlen wie ICAM-1 und Zytokinen wie lnterleukin-6 und lnterleukin-8 bewirken. Dies kann zu deren Akti- 
40 vierung und zur Zellaggregation fuhren. Das Expressionsmuster des VESPR- Rezeptors zeigt teilweise interessante 
Paralleln zu H-Senal, z.B. eine Starke Expression in Placenta und eine deutliche Expression in Milzgewebe. Interaktio- 
nen mit weiteren, noch unbekannten Rezeptoren der Plexin-Familie, Oder anderen Rezeptoren sind mdglich. Auch eine 
Interaktion mit sich selbst Oder anderen semaphorin&hnlichen Molekulen ist mfiglich. Eine Interaktion der Semaphorine 
vom Typ L kann insbesondere Ober eine konservierte Domane im C-terminalen Bereich der Sema-Dom&ne stattfinden. 

45 

Zu den Annotation Plasmiden: 

pMelBacA-H-SemaL (6622bp) in pMelBacA (Invitrogen, De Schelp, NL)(SEQ ID NO. 42). Nukleotid 96-98 ATG - 
Startkodon, Nukleotid 96-168 Mellitin Signal-Sequenz, Nukleotid 168-173 BamHI Schnittstelle (PCR/KIonierung), 
so Nukleotid 

171-1998 Leserahmen SemaL AminosSuren 42-649 (ohne eigene Signal-Sequenz und ohne Transmembranse- 
quenz), Nukleotid 1993-1998 EcoRI Schnittstelle (PCR/KIonierung) und Nukleotid 1992-1994 Stop Codon 

Plasmid pCDNA3.1 -H-SemaL-MychisA (7475 bp) (SEQ ID NO. 35): 

55 Nukleotid 954-959 BamHI Schnittstelle (Klonierung), 

Nukleotid 968-970 ATG SemaL, Nukleotid 968-2965 Leserahmen SemaL, Nukleotid 2963-2968 Pml I Schnittstelle, 
Nukleotid 2969-2974 Hindlll Schnittstelle. 

Nukleotid 2981-3013 Myc-Tag, Nukleotid 3026-3033 6xHis-Tag, Nukleotid 3034-3036 Stop Codon, 
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Plasmid pCDNA3.1-H-SemaL-EGFP-MychisA (8192 bp): (SEQ ID NO. 36): 

Nukleotid 954-959 BamHI Schnittstelle (Klonierung), Nukleotid 968-970 ATG SemaL, Nukleotid 968-2965 Leserah- 
men SemaL, Nukleotid 2963-2965 halbe Pml I Schnittstelle, Nukleotid 2966-3682 Leserahmen EGFP (in Pml I Klo- 
niert), Nukleotid 3683-3685 halbe Pml I Schnittstelle, Nukleotid 3685-3691 Hindlll, Nukleotid 3698-3730 Myc-Tag, 
5 Nukleotid 3743-3760 6xHis-Tag, und Nukleotid 3761 -3763 Stop Codon 

Plasmid pIND-H-SemaL-EA (7108 bp) in Vektor pIND (Invitrogen, De Schelp, NL) (SEQ ID No. 38): 

Nukleotid 533-538 BamHI Schnittstelle (Klonierung), Nukleotid 546-548 ATG SemaL, Nukleotid 546-Leserahmen 
SEMAL, Nukleotid 2542-2547 Pml I Schnittstelle, Nukleotid 2546-2553 Hindlll Schnittstelle und Nukleotid 2563- 
io 2565 Stop Codon. 

Plasmid pIND-H-SemaL-EE (Gesamtl&nge 7102 bp) in Vektor pIND (Invitrogen, De Schelp, NL) (SEQ ID No. 37): 
Nukleotid 533-53B BamHI Schnittstelle (Klonierung), Nukleotid 546-548 ATG SemaL, Nukleotid 546-Leserahmen 
SemaL, Nukleotid 2542-2547 Pml I Schnittstelle, Nukleotid 2548-2553 Hindlll Schnittstelle, Nukleotid 2560-2592 
is Myc-Tag, Nukleotid 2605-2622 6xHis-Tag und Nukleotid 2623-2625 Stop Codon. 

Plasmid pQE30-H-SemaL-179-378.seq (4019 bp) in Vektor pQE30 (Qiagen, Hilden) entspricht pQE30-H- 
SemaLBH (SEQ ID No. 39): 

Nukleotid 115-117 ATG, Nukleotid 127-144 6xHis-Tag, Nukleotid 145-750 BamHI-Hindill PCR-Fragment SemaL 
20 Aminos3uren (aa) 179-378 und Nukleotid 758-760 Stop Codon. 

Plasmid pQE31-H-SemaL- (SH (3999 bp) in Vektor pQE31 (Qiagen, Hilden) (SEQ ID No. 40): 

Nukleotid 115-117 ATG, Nukleotid 127-144 6xHis-Tag, Nukleotid 147-152 BamHI, Nukleotid 159-729 Sacl-Hindlll 
Fragment SemaL (C-terminal) aa480-666 und Nukleotid 734-736 Stop Codon. 

25 

Beispiele: 



Versuchsbedingungen, die in den Beispielen Anwendungfinden: 



30 Verwendete PCR-Programme: 



35 



40 



45 



50 



Taq52-60 (mit Ampli-Taq R -Polymerase, Perkin Elmer, Weil der Stadt, Deutschland) 



96°C/60s 1 Zyklus 

96°C/1 5s-52°C/20s*70°C/60s 40 Zyklen 

70°C/60s 1 Zyklus 

Taq60-30 

96°C/60s 1 Zyklus 

96°C/1 5s-60°C/20s-70°C/30s 35 Zyklen 

70°C/60s 1 Zyklus 

Taq60-60 

96° C/60 s 1 Zyklus 

96°C/1 5s-60°C/20s-70°C/60s 35 Zyklen 

70°C/60s 1 Zyklus 



Taq62-40 



96° C/60 s 1 Zyklus 

96°C/1 5s-62°C/20s-70°C/40s 35 Zyklen 

70°C/60s 1 Zyklus 

55 

Verwendete Reaktionsbedingungen fOr PCR mit Taq-Polymerase: 



50|xl Reaktionsans&tze mit 100-200ng Template, 200jxM dNTP, 0,2-0, 4 jxM je Primer, 2.5U Ampli-Taq R , 5pl des mit- 
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gelieferten lOx Reaktionspuffers 
Verwendete Programme fur: 

s 1 . XL62-6 (mit Expand-Long Template PCR System R , Boehringer Mannheim, Deutschland) 

94°C/60s 1 Zyklus 

94° C/1 5s-62° C/30s-68°C/6min 1 0 ZyWen 

94° C/1 5s-62°C/30s-68°C/(6min+1 5s/Zyklus) 25 ZyWen 

io 68°C/7min 1 ZyWus 

2. XL62-12 (mit Expand-Long Template PCR System R , Boehringer Mannheim, Deutschland) 

94°C/60s 1 ZyWus 

is 94°C/1 5s-62°C/30s-68°C/1 2min 1 0 ZyWen 

94°C/1 5s-€2°C/30s-68°C/(1 2min+1 5s/ZyWus) 25 ZyWen 

68°C/7min 1 ZyWus 

Reaktionsbedingungen fur PCR mit Expand-Long Template PCR System 

20 

50nJ ReaktionsansStze mit 100-200ng Template, 500|iM dNTP, 0.2-0.4 pM je Primer, 0,75pl Enzym-Mix, 5pU des 
mitgelieferten 1 0x Reaktionspuffers Nr. 2. 

Beispiel 1 : 

25 

Ausgehend von Sequenzen des AHV-Sema (Ensser u. Fleckenstein (1995), J. General Virol. 76: 1063-1067) wur- 
den PCRs und RACE-PCRs durchgefuhrt Als Ausgangsmaterial hierfOr diertte humane cDNA aus Plazenta-Gewebe, 
an welche Adapter zur RACE-Amplifikation ligiert wurden (Marathon™-cDNA Amplification Kit, Clontech Laboratories 
GmbH, TulIastraBe 4, 69126 Heidelberg, Deutschland). ZunSchst wurde mittels spezifischer Primer (Nr. 121234 + Nr. 
30 121236, Tabelle 6) ein PCR-Fragment mit einer Lange von etwa 800bp (Basenpaaren) amplifiziert (PCR-Programm: 

(Taq60-60)). Dieses wurde Woniert und sequenziert (Taq-Dye-Deoxy-Terminator Sequenzierungs-Kit, Applied Biosy- 
stems, Foster: City, CA USA) Brunnenweg 13, Weilderstadt). Die Sequenzierung des PCR-Produkts ergab eine 
Sequenz, die eine hohe Homologie zu der DNA-Sequenz von AHV-Sema aufweist, identisch zu der Sequenz der bei- 
den ESTs. 

35 Ein PCR-Fragment von 600bp wurde mit dem Primerpaar (Nr. 121237 + Nr. 121239, Tabelle 6) identifiziert Es 
zeigte sich, das es sich um Klone mit DNA-Sequenzen des selben Gens handelte. 

Beispiel 2: 

40 Das 800bp PCR-Fragment aus Beispiel 1 wurde radioaktiv marWert (Random-Priming nach der Methods von 
{Feinberg (1983) Anal. Biochem. 132:6-13), mit 32 P-a-dCTP) und als Sonde fur einen Multi-Tissue Northern-Blot 
(Human Multiple Tissue Northern Bot II, Clontech, Heidelberg, Germany), der mRNA-Proben aus den Geweben Milz, 
Thymus, Prostata, Testis. Ovarien, Dunndarm, Dickdarm und Leukozyten (PBL) enthait, verwendet. Dabei Zeigte sich 
deutlich die Expression einer mRNA mit einer Lange von etwa 3.3kb in Milz und Keimdrusen (Hoden, EierstOcken), 
45 sowie schwacher in Thymus und Darm. Eine Hybridisierung eines Master-Blots (Dotblot mit RNA aus zahlreichen 
Geweben (Human RNA Master Blot™, Clontech) bestatigte dieses Ergebnis und zeigte auch eine starke Expression in 
Plazenta-Gewebe. 

Die Hybridisierung wurde fur 16 Stunden unter stringenten Bedingungen (SxSSC, 50 mM Na-Phosphat pH 6.8, 50 
% Formamid, 100 pg/ml Hefe-RNA) bei42°C durchgefuhrt. Die Blots wurden stringent gewaschen (65°C, 0.2XSSC, 0.1 
so % SDS) und einem Fuji BAS2000 Phosphoimager ™ exponiert 

Beispiel 3: 

Eine cDNA-Bibliothek aus humaner Milz, Woniert in dem Bakteriophagen Lambda gtIO (Human Spleen 5' 
55 STRETCH PLUS cDNA, Clontech) wurde mit dieser Sonde durchsucht und ein Lambda-Klon identifiziert Die in diesem 
Klon inserierte cDNA mit einer Lange von 1 6kb wurde mittels PCR (Expand™ Long Template PCR System, Boehringer 
Mannheim GmbH, Sandhofer StraBe 116, 68305 Mannheim) amplifiziert wobei die vektorspezifischen Primer Nr. 
207608 + Nr. 207609 (Tabelle 6) verwendet wurden (flankierend der EcoRI-KIonierungsstelle) und das erhaftene PCR- 
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Fragment sequenziert. Dieser Klon enthielt das 5' Ende der cDNA und erweiterte die bekannte cDNA Sequenz auch 
nach 3’. Ausgehend von den neuen Teilsequenzen der cDNA wurden neue Primer far die RACE-PCR entwickelt (Nr. 
232643, Nr. 232644, Nr. 233084, Tabelle 6). Zusammen mit einer verbesserten Thermocyclertechnik (PTC-200 von 
MJ-Research, Biozym Diagnostik GmbH, 31833 Hess. Oldendorf) mit deutlich besseren Leistungsdaten (Heiz- und 
5 Kuhlrate) wurde ein 3 - RACE PCR-Produkt amplifiziert wobei die Primer Nr. 232644 bzw. Nr. 232643 und API verwen- 
det wurden und in den Vektor pCR2.1 (Invitrogen, De Schelp 12, 9351 NV Leek, Niederlande) kioniert. Das 3 -RACE 
PCR-Produkt wurde Sequenziert und auf diese Weise das 3'Ende der cDNA identifiziert. Eine RACE-Amplifikation 
nach 5* (Primer Nr. 131990 bzw. Nr. 233084 und API) erweiterte das 5’ Ende der cDNA um wenige Nukleotide und 
bestatigte den im identifizierten Lambda-Klon gefundenen Aminoterminus des H-SemaL. 

10 

Beispiel 4: 

Ausgehend von einem kurzen murinen EST (Zuordnungs-Nr. AA260340) und einem daraus abgeleiteten Primer 
Nr. 260813 (Tabelle 6) und dem H-SemaL spezifischen Primern Nr. 121234 (Tabelle 6) wurde mittels PCR (Bedingun- 
is gen: Taq52-60) ein DNA-Fragment mit einer Lange von ca. 840 bp muriner cDNA amplifiziert und in den Vektor pCR2. 1 
kioniert. Das dieses DNA-Fragment enthaHende Gen wurde M-SemaL genannt. Mit dem erhaltenen M-SemaL DNA- 
Fragment eine cDNA-Bank aus Mause-Milz (Mouse Spleen 5’ STRETCH cDNA, Clontech) untersucht, wobei bereits 
mehrere Klone identifiziert werden konnten. 

PCR (Taq60-30) mit den Primern Nr. 260812, Nr.260813 aus muriner, endothelialer cDNA lieferte ein PCR-Frag- 
20 ment mit einer Lange von 244 Basenpaaren. Die PCR-Ergebnisse zeigten, daB eine deutliche basal© Expression in 
murinen Endothelzellen vorhanden ist, welche nach Stimulation mit dem Zytokin Interferon-y und Upopolysacchariden 
zuruckgeht. 

Beispiel 5: 

25 

Untersuchungen zur Chromosomalen Lokalisation wurden mittels Fluoreszenz in-situ Hybridisierung (FISH) durch- 
gefuhrt. Dazu wurden Metaphase Chromosomen von Mensch und Maus, ausgehend von einer humanen Blutprobe 
bzw. der Mauszellinie BINE 4.8 (Keyna etal. (1995) J. Immunol. 155, 5536-5542), hergestellt (Kraus et al. (1994) Geno- 
mics 23, 272-274). Die ObjekttrSger wurden mit RNase und Pepsin behandelt (Liehr et al. (1995) Appl. Cytogenetics 
30 21, 185-188). Fur die Hybridisierung wurden 120 mg humane Nick-translatierte Semaphorin-Probe bzw. 200 mg einer 

entsprechenden Mausprobe verwendet. Die Hybridisierung wurde jeweils in Gegenwart von 4.0 jxg COT1-DNA und 20 
p.g STD bei 37°C (3 Tage) in einer befeuchteten Kammer durchgefuhrt. 

Die Objekttr&ger wurden mit 50% Formamid/2x SSC (3 mal je 5 min bei 45°C) und dann mit 2 x SSC (3 mal je 5 
min bei 37°C) gewaschen und die biotinylierte Probe mit dem FITC- Avid in-System (Liehr et al. (1995)), detektiert. Die 
35 ObjekttrSger wurden mit Hilfe eines Fluoreszenz-Mikroskops ausgewertet. Es wurden 25 Metaphasen/Probe ausge- 
wertet, wobei jedes Experiment doppelt durchgefuhrt wurde. Es zeigt sich, daB H-SemaL auf Chromosom 15q23 loka- 
lisiert ist Chromosomal benachbart liegen der Locus fiir das Bardet-Biedl-Sydrom und Tay-Sachs Erkrankung 
(Hexosaminidase A). 

40 Beispiel 6: 

Die genomische Intron-Exon Struktur des H-SemaL Gens ist zum grOBten Teil aufgekiart. 

Genomische DNA Fragment© wurden ausgehend von 250 mg humaner genomischer DNA, die aus PHA stimmu- 
lierten pheripheren Lymphozyten (Blut) isoliert worden waren, amplifiziert. Kurzere Fragmente wurden mit Ampli Taq R 
45 (Perkin Elmer), langere Fragmente mit dem Expanded Long Templat PCR System 0 (Boehringer Mannheim) amplifi- 
ziert. 

Durch PCR-Amplifikation konnte bisher fast der vollst&ndige genomische Locus des H-SemaL kioniert und charak- 
terisiert werden. Insgesamt konnten bereits mehr als 8888 bp der genomischen Sequenz bestimmt werden und so die 
Irrtron-Exon-Struktur des Gens weitgehend aufgekl&rt werden. 

50 

Beispiel 7: 

Expressionsklonierungen: 

Da kein kompletter Klon des Semaphoringens aus der Lambda-gtIO cDNA-Bank isoliert werden konnte, und auch mit- 
55 tels PCR ein vollstandiger Klon nicht zu erhalten war, wurde der kodierende Bereich der cDNA in 2 uberlappenen Sub- 
fragmenten mittels PCR (XL62-6) mit Hilfe der Primer Nr. 240655 und Nr. 121339 for das N-terminale DNA-Fragment, 
sowieden Primern Nr. 240656 (enthait Hindlll und Pmel Schnittstellen) und Nr. 121234 fur das C-terminale DNA-Frag- 
ment amplifiziert. Die erhaltenen DNA-Fragmente (Subfragmente) wurden in den Vektor pCR21 kioniert Die beiden 
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Subfnagmente wurden komplett sequenziert und schlieBlich die vollstandige H-SemaL cDNA durch Insertion eines 
0.6kb C-terminalen Sstl-Hindlll Restriktions-Fragments in das mitden Restriktionsenzymen Sstl und Hindlll geschnit- 
tene, das N-terminale DNA-Fragment enthaltende Plasmid, hergestellt. Aus diesem Plasmid pCR2. 1 -H-SemaL (gemSB 
Tabelle 7 - SEQ 10 NO - 34 > wurde das komplette Gen mittels der EcoRI-Schnittstelle (in pCR2.1) und Hin- 
s d -Schnittstelle (in Primer Nr. 240656, Tabelle 6) herausgeschnitten und in einen entsprechend geschnittenen konsti- 
^ e K?i? reSSi0nSVeW0r P CD NA3.1(-)MycHisA (Invitrogen) ligiert Aus dem resultierenden rekombinanten Plasmid 
pCDNA3. 1(-)H-SemaL-MycHisA (gemSB Sequenz in Tabelle 8) wurde das EcoRI-Apal Fragment (ohne Myc-His-Tag) 
herausgeschnitten und in den induzierbaren VektorpIND ligiert (Ecdysone-lnducible Mammalian Expression System 
Invitrogen), der zuvor ebenfalls mit EcoRI-Apal geschnitten worden war. Das rekombinante Plasmid wurde mit plND-H- 
io SemaL-EA (Sequenz gemSB Tabelle 1 1) bezeichnet Ein EcoRI-Pmel-Fragment (mit Myc-His-Tag) aus pCDNA3.1(-)H- 
SemaL-Myc-HisA (Sequenz gemaG Tabelle 9) wurde in einen mit EcoRI-EcoRV geschnittenen Vektor pIND einqesetzt 
Das rekombinante Plasmid wurde mit pIND-H-SemaL-EE (Sequenz gemaG Tabelle 10) bezeichnet. 

B ? o° nS9en VOn H ‘ Se,TlaL mit Enhanced Green Fluorescent Protein (EGFP) wurde hergestellt durch Ligation des 
m EGFP ‘ Leserahmen s (aus dem Vektor pEGFP-CI (Clontech). mit Hilfe der Primer Nr. 243068 + 

15 ,^ q „ 52 ‘ 6 ° ) ^ die Pmel-Schnrttstelle des Plasmids pCDNA3.1(-)H-SemaL-MycHisA wodurch das Plasmid 

pCDNA3.1(-)H-SemaL-EGFP-MycHisA (Sequenz gem§f3 Tabelle 9) erhalten wurde. 

In den Tabellen 7 bis 13 bedeuten kleine Buchstaben die Sequenz von H-SemaL, Teilen Oder Derivaten derselben 
und groBe Buchstaben die Sequenz des Plasmids. 

20 Beispiel 8: 

Zur Herstellung von H-SemaL spezifischen Antikorpern wurden cDNA-Fragmente von H-SemaL in prokaryotische 
Expressionsvektoren mtegriert, in E. coli exrimiert und die Semaphorin-Derivate aufgereinigt. Die Semaphorin-Derivate 
wurden als Fusionsproteine mit einem His-Tag exprimiert Dementsprechend wurden Vektoren verwendet. die die 
Sequenz tor ein His-Tag enthalten und eine Integration des Semaphorin cDNA-Fragments im Leserahmen ermOglich- 
ten. Ein ^-terminates 6xHistidin-Tag ermOglicht z.B. eine Aufreinigung mittels Nickel-Chelat-Affinitatschromalographie 
(Qiagen GmbH, Max-Volmer StraGe 4. 40724 Hilden): 

d'« i AminosSuren 179-378 kodierende Teil der H-SemaL cDNA wurde mittels PCR mit den Primern Nr. 
150788 und Nr. 150789 amplifiziert und dieses DNA-Fragment in den Vektor pQE30 (Qiagen), der zuvor mit den 
Restriktionsenzymen BamHI und Hindlll geschnitten worden war, ligiert (Konstrukt pQE39-H-SemaL-BH (Seauenz 
gemae Tabelle 12)). ^ 

2. Der for die C-terminalen AminosSuren 480-666 kodierende Abschnitt der H-SemaL cDNA wurde mit den 
Restriktionsenzymen Sstl und Hindlll aus dem Plasmid pCR 2.1 geschnitten und in den Vektor pQE31 (Qiagen) 
r ' * SSt ' Uf1d Hindl " geschnitten worden war ligiert (Konstrukt pQE31-H-SemaL-SH (Sequenz gemaG 

Die korrekte Integration der Sequenzen im richtigen Leserahmen wurde durch DNA-Sequenzierung OberprQft Die 
Fusion^roteine, bestehend aus einem N-terminalen 6xHistidin-Taq und einem Teil des Semaphores H-SemaL wur- 
den mittels Ni -Affinitatschromatographie aufgereinigt. Die aufgereinigten Fusionsproteine wurden zur Immunisierung 
von verschiedenen Tieren (Hase, Huhn, Maus) benutzt 9 

Beispiel 9: 



25 
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FACS-Analyse verschiedener Zelltypen (Rguren 4 und 5) 

DieZeMen (ca_0.2-0.5 x 10 6 ) wurden mit FACS-Puffer gewaschen (Phosphate-buffered Saline (PBS) mit 5%f6talem 
Kaiberserum (FCS) und 0.1% Na-Azid) und dann jeweils (auf Eis) fur 1 Stunde mit den Antiseren inkubiert 
Als pnmare Antikbrper dienten fur die Kontrolle (Overlay Huhner-Praimmunserum (1 : 50) und fur den spezifischen 
Nachweis (Spezifische Farbung) ein H-SemaL spezifisches HOhner-Antiserum (1 : 50). 

Das spezifische Antiserum mit AntikOrpern gegen Aminosauren (Aa) 179-378 (mit N-terminalem His-Tag) von H- 
SemaL wurde durch Immunisierung von HOhnern mit dem durch Ni-Chelat-Affinitatschromatographie gereinigten Pro- 
tem erzeugt (wie in Beispiel 8 beschrieben). y 

Als zweiter AntikOrper wurde ein FITC-marWerter anti-Huhn F(ab’) AntikOrper aus Kaninchen verwendet (Dianova Jack- 
son Laboratories, Best-Nr. 303-095-006, Hamburg, Deutschland) (1 mg/ml) 

For die CDIOO-Faibung: wurde ein Rabbit-anti-Maus IgG, FITC-marWert verwendet Der zweite AntikOrper wurde 
jeweils in 1 ; 50 Verdunnung in FACS-Puffer eingesetzt. 

Dann wurden die Zellen gewaschen, in PBS resuspendiert und im FACS analysiert. Die FACS-Analyse wurde mit 
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einem FACS-Trak Gerat (Becton — Dickinson) durchgefuhrt Prinzip: Eine Einzelzellsuspension wird in einen Messkanal 
vorbeigeleitet, dort wenden die Zellen mil Laserlicht von 488nm bestrahlt und so Fluoreszenzfarbstoffe (FITC) angeregt. 
Gemessen werden Streulicht nach vorne (forward scatter, FSC: korreliert mit der ZellgrOBe), zur Seite (sideward scat- 
ter, SSC: korreliert mitdem Granulargehalt: bei unterschiedlichen Zelltypen unterschiedlich) und Fluoreszenz im Kanal 
5 1 (FL 1) (fur Welleniangen im FITC Emissionsbereich. max. bei 530nm). Auf diese Weise wurden je 10000 Ereignisse 

(Zellen) gemessen. 

Der Dotplot (Figuren 4a - k) (jeweils link© Abbildung): FSC gegen SSC (GrOBe gegen GranulargehaIVStreuung), darin 
eingegrenzt ist die im rechten Fenster (jeweils zugehdrige rechte Abbildung) analysierte (einheitfiche) Zellpopulation 
von ahnlicher GrOBe und Granulargehalt. Das rechte Fenster zeigt die Intensrtat von FL1 (X-Achse) gegen die Zahl der 
io Ereignisse (V-Achse), also eine Hdufigkeitsverteilung. 

Hierbei istjeweils das Ergebnis mit dem Kontrollserum (nichtgefullte Kurve) dem Ergebnis der spezrfischen FSrbung 
(ausgefullte Kurve) uberlagert. Eine Verschiebung der Kurve fur die spezifische FSibung gegenuber der Kbntrolle nach 
rechts entspricht einer Expression von H-SemaL in den entsprechenden Zellen. Je weiter die Verschiebung, desto star- 
ker ist die Expression. 

is Fur FACS Analyse verwendete Zellinien: 

a) Zellinie U937 

American Type Culture Collection ATCC; ATCC Nummer: CRL-1593 Name: U-937 
Gewebe: lymphoma; histiocytic; Monozytenahnlich 
20 Species: human; 

Hirrterleger: H. Koren 

b) Zellinie THP-1 
ATCC Nummer: TIB-202 

Gewebe: monocyte; acute monocytic leukemia 
25 Species: human 

Hinterleger: S. Tsuchiya 

c) Zellinie K-562 

ATCC Nummer: CCL-243 
Gewebe: chronic myelogenous leukemia 
30 Species: human; 

Hinterleger H.T. Holden 

d) Zellinie L-428 

DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH, DSMZ Nr: ACC 197 
Zelltyp: human Hodgkin’s lymphoma 
35 e) Zellinie Jurkat 

DSMZ-Deutsche Sammlung von Mikroorganismen und zellkulturen GmH, DSMZ Nr: ACC 282 
Zelltyp: human T cell leukemia 

f) Zellinie Daudi 

ATCC Number: CCL-213 

40 Gewebe: Burkitt’s lymphoma; B lymphoblast; B Zellen 

Species : human 
Hinterleger: G. Klein 

g) Zellinie LCL 

EB V-transfor mi erte lymphoblastoide B-Zellinie. 

45 h) Zellinie Jiyoye (P-2003) 

ATCC Number: CCL-87 

Gewebe: Burkitt's lymphoma; B Zellen; B lymphocyte 
Species: human 
Hinterleger: W. Henle 
50 i) CBL-Mix57 

humane T-Zellinie (isoliert aus Blut) transformiert mit rekombinantem H. Saimiri (Wild-typ ohne Deletion) 

j) CBL-Mix59 

humane T-Zellinie (isoliert aus Blut) transformiert mit H. Samiri (Deletion von ORF71). 

55 Beispiel 10: Proteingel und Western-Blot 

Sekretierbare humane SemaL (AminosSuren 42-549 in Tabelle 4 (ohne Signalpeptid und ohne Transmembrando- 
mane) wurde in das Plasmid pMelBac-A (Invrtrogen, De Sehelp, Leek, Niederlande, Cv 1 950-20) Woniert und auf diese 
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Weise das Plasmid pMelBacA-H-SemaL (Lange 6622bp) erzeugt (Tabelie 15,Figur 8). Das H-SemaL Derivat wurde im 
Bacuiovirus-System (Bac-N-Blue, Invitrogen) exprimiert Die Expression wurde in den Insekten-EizeNen abgeleiteten 
Zeilinien Sf9 (von Spodoptera flugiperda) und High Five™ (von Trichoplusia ni, U.S. Pat. No. 5,300,435, gekauft von 
Invitrogen) durch Irrfektion mil den rekombinanten, plaquegereinigten Baculoviren ausgefOhrt. 

5 Die Expression wurde nach den Angaben des Herstellers durchgefOhrt. 

AnschlieBend wurden die Proteine in einem Gel aufgetrennt und das H-SemaL Derivat im Western-Blot nachgewiesen. 
Die Detektion wurde mit dem H-SemaL spezifischen Huhnerantiserum (vergl. Beispiel 8 und Figur 7) (Verdunnung: 
1:100) durchgefOhrt Der spezrfische HQhnerantikOrper wurde mit anti-lgY-HRP Kbnjugat (VerdQnnung: 1:3000, vom 
Kaninchen; Dianova Jackson Laberatories) nach Angaben des Herstellers nachgewiesen. 

10 

Beispiel 1 1 : Herstellung von pMelBacA-HSEMAL 

Der rekombinante Veklor (pMelBacA-HSEMAL, 6622bp) wurde hergestellt, indem ein entsprechendes DNA-Frag- 
ment, das fur die AminosSuren 42-649 von H-SemaL kodiert, in den Vektor pMelBacA (4,8 kb, Invitrogen) kloniert 
is wurde (vergl. Annotation zu pM el BacA- H-SemaL). Die Klonierung erfolgte uber BamHI und EcoRI in frame hinter die in 
dem Vektor vorliegende Signaisequenz (..honeybee melittin signal sequence"). Ein entsprechendes H-SemaL DNA- 
Fragment wurde mit dem Primerpaar H-Sema 1 baculo 5* und H-Sema 1 baculo 3' amplifiziert. 

Primer zur Amplifikation (TaKaRa Ex Taq- Polymerase) und Klonierung: 

„H-Sema 1 baculo 5'„ zur Amplifikation ohne Signaisequenz und zur Einfuhrung einer BamHI-Schnittstelle 
2a 5'-CCGGATCCGCCCAGGGCCACCTAAGGAGCGG-3' (SEQ ID NO: 43) 

„H-Sema 1 baculo 3’,, zur Amplifikation ohne Transmembrandomfine und zur Einfuhrung einer EcoRI-Schnittstelle 
5*- CT GAATT CAGG AG CCAGGGCAC AGGC AT G-3’ (SEQ ID NO: 44). 

Abbildungen: 

25 

Figur 1: 

Gewebespezifische Expression von H-SemaL 

30 A) Mehrfach-Gewebe Northern Blot (Clontech, Heidelberg, Deutschland). Von links nach rechts sind aufgetragen: 
Je 2 ilq Poly-A-RNA pro Spur aus Milz, Thymus, Prostata, Hoden, Eierstdcken, Dunndarm, Dickdarm Mukosa. phe- 
ripheren (Blut-) Leukozyten. GrOBenstandards sind markiert. 

Die Biots wurden unter stringenten Bedingungen mit einer 800 Basenpaaren langen H-SemaL Probe hybridisiert 

35 

Figur 2: 

Schematische Darstellung der Klonierung der H-SemaL cDNA und der genomischen Organisation der H-SemaL 
kodierenden Sequenzen (H-SemaL Gen) 

40 Oben: Lokalisation der EST-Sequenzen (Zugangsnummern; Lage der EST-Sequenzen ist relativ zur AHV-Sema 
Sequenz dargestellt). 

Darunter: Amplifizierte PCR- und RACE-Produkte sowie die Position der cDNA Klone im Bezug auf die Lokalisation in 
der vollstfindigen H-SemaL cDNA und dem offenen Leserahmen (ORF) fur das kodierte Protein. 

Unten: Relative Position der Exons im H-SemaL Gen im Bezug auf die genomische Sequenz. 

45 Die Position der verwendeten Oligonukleotid Primer ist durch Pfeile angezeigt 

Figur 3: 

Phylogenetischer Baum: Erhalten durch mehrfaches Alignment der aufgefuhrten Semaphorin Sequenzen. Auf- 
so grund der Gruppierung der Semaphorine in dem phylogenetischen Baum kann auf deren phylogenetische Verwandt- 
schaft geschlossen werden. 

Figur 4: 



55 
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FACS Analyse der H-SemaL Expression in verschiedenen Zeilinien bzw. verschiedenen Zelltypen (vergl. Beispiel 
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Figur 5: 

Vergleichende Analyse der CD 100 und H-SemaL Expression (vergl. Beispiel 9). 

5 Figur 6: Expression von sekretierbarem humanen SEMAL (H-SemaL) in HiFive und Sf3-Zellen (vergl. Beispiel 10). 

(Aa 42-649 in pMelBac-A (Invitrogen) im Baculovirus-System (Bac-N-Blue, Invitrogen) Detektion mit spezifischem 
HQhner-Antiserum (1:100) und anti-lgY-HRP Konjugat (1:3000, vom Kaninchen, Jackson Lab.) 

1,4,6 uninfizierte HiFive Zellen (serumfrei) 
io 2, 3, 5, 7,8 mit rekombinarrtem Baculovirus infizierte HiRve Zellen (serumfrei) 

M Rainbow molecular weight marker (Amersham RPN756) 

9,10 infizierte Sf9 Zellen (serumhaltiges Medium). 

Figur 7: Spezifitat des Antiserums 

15 

Spuren 1-3: Huhn 1; Spuren 4-6: Huhn 2 
Spuren 1 und 4: Praimmunserum 
Spuren 2 und 5: 60. Immunisierungstag 
Spuren 4 und 6: 105. Immunisierungstag 

20 Immunisiert wurde mit den Aminosauren 179-378 von H-SemaL (mit aminoterminalem His-Tag) (vergl. Beispiel 8, 
Punktl.) 

Figur 8: Abbildung der Plasmidkarte von pMelBacA-HSEMAL 
25 Das rekombinante Plasmid wurde wie in Beispiel 1 1 beschrieben, hergestellt 
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Verschiedene Subtypen von Semaphorinen aus verschiedenen Spezies 
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Tabelle 2: cDNA-Sequenz von H-SemaL (2636 NukleotkJe) (SEQ ID NO.: 1 ) 



5 


1 


cggggccacg 


ggatgacgcc 


tcctccgccc 


ggacgtgccg 


cccccagcgc 




51 


accgcgcgcc 


cgcgtccctg 


gcccgccggc 


tcggttgggg 


cttccgctgc 




101 


ggctgcggct 


gctgctgctg 


ctctgggcgg 


ccgccgcctc 


cgcccagggc 


10 


151 


cacctaagga 


gcggaccccg 


catcttcgcc 


gtctggaaag 


gccatgtagg 




201 


gcaggaccgg 


gtggactttg 


gccagactga 


gccgcacacg 


gtgcttttcc 




251 


acgagccagg 


cagctcctct 


gtgtgggtgg 


gaggacgtgg 


caaggtctac 




301 


ctctttgact 


tccccgaggg 


caagaacgca 


tctgtgcgca 


cggtgaatat 


15 


351 


cggctccaca 


aaggggtcct 


gtctggataa 


gcgggactgc 


gagaactaca 




4 01 


tcactctcct 


ggagaggcgg 


agtgaggggc 


tgctggcctg 


tggcaccaac 




451 


gcccggcacc 


ccagctgctg 


gaacctggtg 


aatggcactg 


tggtgccact 


20 


501 


tggcgagatg 


agaggctacg 


cccccttcag 


cccggacgag 


aactccctgg 


551 


ttctgtttga 


aggggacgag 


gtgtattcca 


ccatccggaa 


gcaggaatac 




601 


aatgggaaga 


tccctcggtt 


ccgccgcatc 


cggggcgaga 


gtgagctgta 




651 


caccagtgat 


actgtcatgc 


agaacccaca 


gttcatcaaa 


gccaccatcg 


25 


701 


tgcaccaaga 


ccaggcttac 


gatgacaaga 


tctactactt 


cttccgagag 




751 


gacaatcctg 


acaagaatcc 


tgaggctcct 


ctcaatgtgt 


cccgtgtggc 




801 


ccagttgtgc 


aggggggacc 


agggtgggga 


aagttcactg 


tcagtctcca 




851 


agtggaacac 


ttttctgaaa 


gccatgctgg 


tatgcagtga 


tgctgccacc 


30 


901 


aacaagaact 


tcaacaggct 


gcaagacgtc 


ttcctgctcc 


ctgaccccag 




951 


cggccagtgg 


agggacacca 


gggtctatgg 


tgttttctcc 


aacccctgga 




1001 


actactcagc 


cgtctgtgtg 


tattccctcg 


gtgacattga 


caaggtcttc 


35 


1051 


cgtacctcct 


cactcaaggg 


ctaccactca 


agccttccca 


acccgcggcc 


1101 


tggcaagtgc 


ctcccagacc 


agcagccgat 


acccacagag 


accttccagg 




1151 


tggctgaccg 


tcacccagag 


gtggcgcaga 


gggtggagcc 


catggggcct 




1201 


ctgaagacgc 


cattgttcca 


ctctaaatac 


cactaccaga 


aagtggccgt 


40 


1251 


tcaccgcatg 


caagccagcc 


acggggagac 


ctttcatgtg 


ctttacctaa 




1301 


ctacagacag 


gggcactatc 


cacaaggtgg 


tggaaccggg 


ggagcaggag 




1351 


cacagcttcg 


ccttcaacat 


catggagatc 


cagcccttcc 


gccgcgcggc 


45 


1401 


tgccatccag 


accatgtcgc 


tggatgctga 


gcggaggaag 


ctgtatgtga 


1451 


gctcccagtg 


ggaggtgagc 


caggtgcccc 


tggacctgtg 


tgaggtctat 




1501 


ggcgggggct 


gccacggttg 


cctcatgtcc 


cgagacccct 


actgcggctg 




1551 


ggaccagggc 


cgctgcatct 


ccatctacag 


ctccgaacgg 


tcagtgctgc 


50 


1601 


aatccattaa 


tccagccgag 


ccacacaagg 


agtgtcccaa 


ccccaaacca 




1651 


gacaaggccc 


cactgcagaa 


ggtttccctg 


gccccaaact 


ctcgctacta 




1701 


cctgagctgc 


cccatggaat 


cccgccacgc 


cacctactca 


tggcgccaca 
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1751 aggagaacgt ggagcagagc tgcgaacctg gtcaccagag ccccaactgc 
1801 atcctgttca tcgagaacct cacggcgcag cagtacggcc actacttctg 
1851 cgaggcccag gagggctcct acttccgcga ggctcagcac tggcagctgc 
1901 tgcccgagga cggcatcatg gccgagcacc tgctgggtca tgcctgtgcc 
1951 ctggctgcct ccctcrtggct gggggtgctg cccacactca ctcttggctt 
2001 gctggtccac tagggcctcc cgaggctggg catgcctcag gcttctgcag 
2051 cccagggcac tagaacgtct cacactcaga gccggctggc ccgggagctc 
2101 cttgcctgcc acttcttcca ggggacagaa taacccagtg gaggatgcca 
2151 ggcctggaga cgtccagccg caggcggctg ctgggcccca ggtggcgcac 
2201 ggatggtgag gggctgagaa tgagggcacc gactgtgaag ctggggcatc 
2251 gatgacccaa gactttatct tctggaaaat atttttcaga ctcctcaaac 
2301 ttgactaaat gcagcgatgc tcccagccca agagcccatg ggtcggggag 
2351 tgggtttgga taggagagct gggactccat ctcgaccctg gggctgaggc 
2401 ctgagtcctt ctggactctt ggtacccaca ttgcctcctt cccctccctc 
2451 tctcatggct gggtggctgg tgttcctgaa gacccagggc taccctctgt 
2501 ccagccctgt cctctgcagc tccctctctg gtcctgggtc ccacaggaca 
2551 gccgccttgc atgtttattg aaggatgttt gctttccgga cggaaggacg 
2601 gaaaaagctc tgaaaaaaaa aaaaaaaaaa aaaaaa 
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T abelle 3: Nukleotidsequenz der cONA von M-SemaL (partied, 1 1 95 Nukleotide) 

(SEQ ID NO.; 2) 

1 cggggctgcg ggatgacgcc tcctcctccc ggacgtgccg cccccagcgc 

51 accgcgcgcc cgcgtcctca gcctgccggc tcggttcggg ctcccgctgc 

101 ggctgcggct tctgctggtg ttctgggtgg ccgccgcctc cgcccaaggc 

151 cactcgagga gcggaccccg catctccgcc gtctggaaag ggcaggacca 

201 tgtggacttt agccagcctg agccacacac cgtgcttttc catgagccgg 

251 gcagcttctc tgtctgggtg ggtggacgtg gcaaggtcta ccacttcaac 

301 ttccccgagg gcaagaatgc ctctgtgcgc acggtgaaca tcggctccac 

351 aaaggggtcc tgtcaggaca aacaggactg tgggaattac atcactcttc 

401 tagaaaggcg gggtaatggg ctgctggtct gtggcaccaa tgcccggaag 

451 cccagctgct ggaacttggt gaatgacagt gtggtgatgt cacttggtga 

501 gatgaaaggc tatgccccct tcagcccgga tgagaactcc ctggttctgt 

551 ttgaaggaga tgaagtgtac tctaccatcc ggaagcagga atacaacggg 

601 aagatccctc ggtttcgacg cattcggggc gagagtgaac tgtacacaag 

651 tgatacagtc atgcagaacc cacagttcat caaggccacc attgtgcacc 

701 aagaccaagc ctatgatgat aagatctact acttcttccg agaagacaac 

751 cctgacaaga accccgaggc tcctctcaat gtgtcccgag tagcccagtt 
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801 


gtgcaggggg 


gaccagggtg 


851 


acaccttcct 


gaaagccatg 


901 


aacttcaatc 


ggctgcaaga 


951 


gtggagagat 


accagggtct 


1001 


cagctgtctg 


cgtgtattcg 


1051 


tcatcgctca 


aaggctacca 


1101 


gtgcctccca 


aaaaagcagc 


1151 


atagtcaccc 


agaggtggct 



gtgagagttc gttgtctgtc tccaagtgga 
ttggtctgca gcgatgcagc caccaacagg 
tgtcttcctg ctccctgacc ccagtggcca 
atggcgtttt ctccaacccc tggaactact 
cttggtgaca ttgacagagt cttccgtacc 
catgggcctt tccaaccctc gacctggcat 
ccatacccac agaaaccttc caggtagctg 
cagagggtgg aacctatggg gcccc 



T abelle 4: Aminosauresequenz von H-SemaL (666 Aminosauren) 

(SEQ ID NO.: 3) 



20 


1 


MTPPPPGRAA 


PSAPRARVPG 




51 


GPRIFAVWKG 


HVGQDRVDFG 




101 


PEGKNASVRT 


VNIGSTKGSC 




151 


SCWNLVN GTV 


VPLGEMRGYA 


25 


201 


PRFRRIRGES 


ELYTSDTVMQ 




251 


KNPEAPLNVS 


RVAQLCRGDQ 




301 


NRLQDVFLLP 


DPSGQWRDTR 




351 


LKGYHSSLPN 


PRPGKCLPDQ 


30 


401 


LFHSKYHYQK 


VAVHRMQASH 




451 


FNIMEIQPFR 


RAAAIQTMSL 




501 


HGCLMSRDPY 


CGWDQGRCIS 




551 


LQKVSLAPNS 


RYYLSCPMES 


35 


601 


ENLTAQQYGH 


YFCEAQEGSY 




651 


LWLGVLPTLT 


LGLLVH 



PPARLGLPLR LRLLLLLWAA AASAQGHLRS 
QTEPHTVLFH EPGSSSVWVG GRGKVYLFDF 
LDKRDCENYI TLLERRSEGL LACGTNARHP 
PFSPDENSLV LFEGDEVYST IRKQEYNGKI 
NPQFIKATIV HQDQAYDDKI YYFFREDNPD 
GGESSLSVSK WNTFLKAMLV CSDAATNKNF 
VYGVFSNPWN YSAVCVYSLG DIDKVFRTSS 
QPIPTETFQV ADRHPEVAQR VEPHGPLKTP 
GET FHVLYLT TDRGTIHKW EPGEQEHSFA 
DAERRKLYVS SQWEVSQVPL DLCEVYGGGC 
IYSSERSVLQ SINPAEPHKE CPNPKPDKAP 
RHATYSWRHK ENVEQSCEPG HQSPNCILFI 
FREAQHWQLL PEDGIMAEHL LGHACALAAS 



40 

Tabelle 5: (Parlielle) Aminosauresequenz von M-SemaL (394 Aminosauren, entspricht Position 1 -396 von 

H-SemaL) (SEQ ID NO.: 4) 

45 1 MTPPPPGRAA PSAPRARVLS LPARFGLPLR LRLLLVFWVA AASAQGHSRS 

51 GPRISAVWKG QDHVDFSQPE PHTVLFHEPG SFSVWVGGRG KVYHFNFPEG 

101 KNASVRTVNI GSTKGSCQDK QDCGNYITLL ERRGNGLLVC GTNARKP SCW 

151 NLVNDSWMS LGEMKGYAPF SPDENSLVLF EGDEVYSTIR KQEYNGKIPR 

50 

201 FRRIRGESEL YTSDTVMQNP QFIKATIVHQ DQAYDDKIYY FFREDNPDKN 

251 PEAPLNVSRV AQLCRGDQGG ESSLSVSKWN TFLKAMLVCS DAATNRNFNR 

55 



23 
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301 LQDVFLLPDP SGQWRDTRVY GVFSNPWNYS AVCVYSLGDI DRVFRTSSLK 

351 GYHMGLSNPR PGMCLPKKQP IPTETFQVAD SHPEVAQRVE PMGP 



10 



15 



20 



Tabelle 6: Synthetische Oligonukleotide, (Eurogenlec, Seraing, Belgien) 



Nummer des 

Primers /Be zeichnung 

91506/AP2 

121234 

121235/Est 2 
121236/Est 3 
121237 /Est 4 
121238 



Nukleotidsequenz des Primers 
Oligonukleotide) 

actcactatagggctcgagcggc 

agccgcacacggtgcttttc 

gcacagatgcgttcttgccc 

accatagaccctggtgtccc 

gcagtgatgctgccaccaac 

ccagaccatgtcgctggatg 



(der synthetischen 

(SEQ ID NO. : 5) 
(SEQ ID NO. : 6) 
(SEQ ID NO. : 7) 
(SEQ ID NO. : 8) 
(SEQ ID NO. : 9) 
(SEQ ID NO.: 10) 



25 



30 



35 



45 



SO 



55 



24 




5 



10 



15 



20 



25 



30 



35 



40 



45 



SO 
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121239/Est 6 


acatgaggcaaccgtggcag 


(SEQ 


ID 


NO. 2 


11) 


13198 9/ AP 1 


ccatcctaatacgactcactatagggc 


(SEQ 


ID 


NO. : 


12) 


13 1990/Est 7 


aggtagaccttgccacgtcc 


(SEQ 


ID 


NO. : 


13) 


131991 


gaacttcaacaggctgcaagacg 


(SEQ 


ID 


NO. : 


14) 


131992 


atgctgagcggaggaagctg 


(SEQ 


ID 


NO. : 


15) 


131993 


ccgccatacacctcacacag 


(SEQ 


ID 


NO. : 


16) 


150788 


ctggaagctttctgtgggtatcggctgc 


(SEQ 


ID 


NO. : 


17) 


150789 


tttggatccctggttctgtttgaag 


(SEQ 


ID 


NO. : 


18) 


167579/cDNA 












ttctagaattcagcggccgcttttttttttttttttttttttttttttttvn 








Synthese Primer 


(SEQ ID NO. : 19) 










168421 


ggggaaagttcactgtcagtctccaag 


(SEQ 


ID 


NO. : 


20) 


168422 


gggaatacacacagacggctgagtag 


(SEQ 


ID 


NO. : 


21) 


207608/ 


agcaagttcagcctggttaagt 


(SEQ 


ID 


NO. : 


22) 


Amplif ikation von 


XgtlO Insert 










207609/ 


ttatgagtatttcttccaggg 


(SEQ 


ID 


NO. : 


23) 


Amplif ikat ion von 


Xgt 10 Insert 










232 643 /Est 13 


ccattaatccagccgagccacacaag 


(SEQ 


ID 


NO. : 


24) 


232 644/Est 14 


catctacagctccgaacggtcagtg 


(SEQ 


ID 


NO. : 


25) 


233084 


cagcggaagccccaaccgag 


(SEQ 


ID 


NO. : 


26) 


240655/hs 5 


gggatgacgcctcctccgcccgg 


(SEQ 


ID 


NO. : 


27) 


240 656/hs 3 


aage ttcacgtggaccagcaagccaagagtg ( SEQ 


ID NO. : 


240 657/hs 3c 


aagctttttccgtccttccgtccgg 


(SEQ 


ID 


NO. : 


29) 


243068 


atggtgagcaagggcgaggagctg 


(SEQ 


ID 


NO. : 


30) 


243069 


cttgtacagctcgtccatgccgag 


(SEQ 


ID 


NO. : 


31) 


260812 


GGGTGGTGAGAGTTCGTTGTCTGTC 


(SEQ 


ID 


NO. : 


32) 


260813 


GAGCGAT GAGGTACGGAAGACTCTG 


(SEQ 


ID 


NO. : 


33) 



Tabelle 7: NukleotkJsequenz des rekombinanten Plasmids pCR2.1-H-SemaL (SEQ ID NO.: 34) 

1 AGCGCCCAAT ACGCAAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA 
51 TGCAGCTGGC ACGACAGGTT TCCCGACTGG AAAGC GGGCA GTGAGCGCAA 
101 CGCAATTAAT GTGAGTTAGC TCACTCATTA GGCACCCCAG GCTTTACACT 
151 TTATGCTTCC GGCTCGTATG TTGTGTGGAA TTGTGAGCGG ATAACAATTT 
201 CACACAGGAA ACAGCTAT GA C CAT GAT T AC GCCaagcttc acgtggacca 
251 gcaagccaag agtgagtgtg ggcagcaccc ccagccagag ggaggcagcc 
301 agggcacagg catgacccag caggtgctcg gccatgatgc cgtcctcggg 
351 cagcagctgc cagtgctgag cctcgcggaa gtaggagccc tcctgggcct 
401 cgcagaagta gtggccgtac tgctgcgccg tgaggttctc gatgaacagg 



25 




iV 
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451 


atgcagttgg 


ggctctggtg 


accaggttcg 


cagctctgct 


ccacgttctc 




501 


cttgtggcgc 


catgagtagg 


tggcgtggcg 


ggattccatg 


gggeagetea 


5 


551 


ggtagtagcg 


agagtttggg 


gccagggaaa 


ccttctgcag 


tggggccttg 




601 


tctggtttgg 


ggttgggaca 


ctccttgtgt 


ggctcggctg 


gattaatgga 




651 


ttgcagcact 


gaccgttcgg 


agctgtagat 


ggagatgcag 


cggccctggt 




*701 


cccagccgca 


gtaggggtct 


cgggacatga 


ggcaaccgtg 


gcagcccccg 


10 


751 


ccatagacct 


cacacaggtc 


caggggcacc 


tggctcacct 


cccactggga 




801 


gctcacatac 


agcttcctcc 


gctcagcatc 


cagcgacatg 


gtctggatgg 




851 


cagccgcgcg 


gcggaagggc 


tggatctcca 


tgatgttgaa 


ggcgaagctg 




901 


tgctcctgct 


cccccggttc 


caccaccttg 


tggatagtgc 


ccctgtctgt 


15 


951 


agttaggtaa 


agcacatgaa 


aggtctcccc 


gtggctggct 


tgcatgcggt: 




1001 


gaacggccac 


tttctggtag 


tggtatttag 


agtggaacaa 


tggegtette 




1051 


agaggcccca 


tgggctccac 


cctctgcgcc 


acctctgggt 


gaeggteage 


20 


1101 


cacctggaag 


gtctctgtgg 


gtatcggctg 


ctggtctggg 


aggeaettge 


1151 


caggccgcgg 


gttgggaagg 


cttgagtggt 


agcccttgag 


tgaggaggta 




1201 


cggaagacct 


tgtcaatgtc 


accgagggaa 


tacacacaga 


cggctgagta 




1251 


gttccagggg 


ttggagaaaa 


caeca tagac 


cctggtgtcc 


ctccactggc 


25 


1301 


cgctggggtc 


agggagcagg 


aagaegtett 


gcagcctgtt 


gaagttcttg 


1351 


ttggtggcag 


catcactgca 


taccagcatg 


gctttzcagaa 


aagtgttcca 




1401 


cttggagact 


gacagtgaac 


tttccccacc 


ctggtccccc 


ctgcacaact 




1451 


gggccacacg 


ggacacattg 


agaggagcct 


caggattctt 


gtcaggattg 


30 


1501 


tcctctcgga 


agaagtagta 


gatettgtea 


tcgtaagcct 


ggtcttggtg 




1551 


cacgatggtg 


gctttgatga 


actgtgggtt 


ctgcatgaca 


gtatcactgg 




1601 


tgtacagctc 


actctcgccc 


eggatgegge 


ggaaccgagg 


gatcttccca 




1651 


ttgtattcct 


gcttccggat 


ggtggaatac 


acctcgtccc 


cttcaaacag 


35 


1701 


aaccagggag 


ttctcgtccg 


ggctgaaggg 


ggcgtagcct 


ctcatctcgc 




1751 


caagtggcac 


cacagtgcca 


tt:caccaggt 


tccagcagct 


ggggtgccgg 




1801 


gcgttggtgc 


cacaggccag 


cagcccctca 


ctccgcctct 


ccaggagagt 


40 


1851 


gatgtagttc 


tcgcagtccc 


gcttatccag 


acaggacccc 


tttgtggagc 


1901 


cgatattcac 


cgtgcgcaca 


gatgegttet 


tgccctcggg 


gaagtcaaag 




1951 


aggtagacct 


tgccacgtcc 


tcccacccac 


acagaggagc 


tgcctggctc 




2001 


gtggaaaagc 


accgtgtgcg 


gctcagtctg 


gccaaagtcc 


acccggtcct 


45 


2051 


gccctacatg 


gcctttccag 


aeggegaaga 


tgcggggtcc 


gctccttagg 


2101 


tggccctggg 


cggaggcggc 


ggccgcccag 


ageageagea 


gcagccgcag 




2151 


ccgcagcgga 


agccccaacc 


gageeggegg 


gccagggacg 


cgggcgcgcg 




2201 


gtgcgctggg 


ggcggcacgt 


ccgggcggag 


gaggegteat 


cccaagccga 


50 


2251 


attcTGCAGA 


TATCCATCAC 


ACTGGCGGCC 


GCTCGAGCAT 


GCATCTAGAG 




2301 


GGCCCAATTC 


GCCCTATAGT 


GAGTCGTATT 


ACAATTCACT 


GGCCGTCGTT 




2351 


TTACAACGTC 


GTGACTGGGA 


AAACCCTGGC 


GTTACCCAAC 


TTAATCGCCT 



55 



26 




2401 TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA 
24 51 CCGATCGCCC TTCCCAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG 
2501 CCCTGTAGCG GCGCATTAAG CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT 
2551 GACCGCTACA CTTGCCAGCG CCCTAGCGCC CGCTCCTTTC GCTTTCTTCC 
2601 CTTCCTTTCT CGCCACGTTC GCCGGC TTTC CCCGTCAAGC TCTAAATCGG 
2651 GGGCTCCCTT TAGGGTTCCG ATTTAGAGCT TTACGGCACC TCGACCGCAA 
2 701 AAAACTTGAT TTGGGTGATG GTTGACGTAG TGGGCCATCG CCCT GATAGA 
2751 CGGTTTTTCG CCCTTTGACG TTGGAGTCCA CGTTCTTTAA TAGTGGACTC 
2801 TTGTTCCAAA CTGGAACAAC ACTCAACCCT ATCGCGGTCT ATTCTTTTGA 
2 851 TTTATAAGGG ATTTTGCCGA TTTCGGCCTA TTGGTTAAAA AATGAGCTGA 
2 901 TTTAACAAAT TCAGGGCGCA AGGGCTGCTA AAGGAACCGG AACAC GTAGA 

2 951 AAGCCAGTCC GCAGAAACGG TGCTGACCCC GGATGAATGT CAGCT ACT GG 
3001 GCTATCTGGA CAAGGGAAAA CGCAAGCGCA AAGAGAAAGC AGGTAGCTTG 
3051 C AGTGGGCT T AC AT GGC GAT AGC TAGAC T G GGCGGTTTTA TGGACAGCAA 
3101 GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC 
3151 T GC AAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GAT GGC GC AG 
32 01 GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATC GT T T CGCATGATTG 
3251 AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGC T A 
3301 TTCGGCTAT G ACTGGGCACA ACAGAC AAT C GGCTGCTCTG ATGCCGCCGT 
3351 GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC 
3401 TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG 
3451 CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA 
3501 AGCGGGAAGG GACT GGC T GC TATTGGGCGA AGTGCC GGGG CAGGATCTCC 
35 51 TGTCATCTCG CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGC TGATGCA 

3 601 AT GC GGC GGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA 
3 651 AGC GAAAC AT C GCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG 
3701 TCGATCAGGA TGATCTGGAC GAAGAGC AT C AGGGGCTCGC GCCAGCCGAA 
3751 CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT 
38 01 GATCCATGGC GATGCCT GCT TGCCGAATAT CATGGTGGAA AATGGCCGCT 
3851 TTTCTGGATT CAACGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG 
3 901 GAC AT AGC GT TGGATACCCG TGATATTGCT GAAGAGC T T G GCGGCGAATG 

3 951 GGC T GAC C GC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC GATTCGCAGC 
4001 GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAAT TGAAAAAGGA 
4051 AGAGTATGAG TATTCAACAT TTCCGTGTCG CCCTTATTCC CTTTTTTGCG 
4101 GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG T GAAAGT AAA 
4151 A GAT GC T G AA GATCAGTT GG GTGCACGAGT GGGTTACATC GAACTGGATC 
42 01 TCAACAGCGG TAAGATCCTT GAGAGT TTTC GCCCCGAAGA ACGTTTTCCA 

4 251 AT GAT GAGCA CTTTTAAAGT TCTGCTATGT CATACACTAT TATCCCGTAT 
4301 TGACGCCGGG CAAGAGCAAC TCGGTCGCCG GGCGCGGTAT TCTCAGAATG 




4351 ACTTGGTTGA GTACTCACCA GTCACAGAAA AGCATCTTAC GGATGGCATG 
4401 ACAGTAAGAG AATTATGCAG TGCTGCCATA AC CAT GAGT G AT AACACT GC 
4451 GGCCAACTTA CTTCTGACAA CGATCGGAGG ACCGAAGGAG CTAACCGCTT 
4501 TTTTGCACAA CATGGGGGAT CATGTAACTC GCCTTGATCG TTGGGAACCG 
4551 GAGCTGAATG AAGCCATACC AAACGACGAG AGT GACACCA CGATGCCTGT 
4601 AGCAAT GCC A ACAACGTTGC GC AAACTATT AACTGGCGAA CT ACT TACT C 
4 651 TAGCTTCCCG GCAACAATTA ATAGACTGGA TGGAGGCGGA TAAAGT T GCA 
4701 GGACCACTTC TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA TTGCTGATAA 
4751 ATCTGGAGCC GGTGAGCGTG GGTCTCGCGG TATCATTGCA GCACTGGGGC 
4 8 01 CAGATGGTAA GCCCTCCCGT ATCGTAGTTA TC T AC AC GAC GGGGAGT CAG 
4 851 GCAACT AT GG ATGAACGAAA TAGACAGATC GCTGAGATAG GTGCCTCACT 

4 901 GAT T AAGC AT TGGTAACTGT CAGACCAAGT T TACTCAT AT ATACTTTAGA 
4951 TTGATTTAAA ACTTCATTTT TAATTTAAAA GGATCTAGGT GAAGATCCTT 

5 001 TTTGATAATC TC AT GAC C AA AATCCCTTAA CGTGAGTTTT CGTTCCACTG 
5051 AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA GATCCTTTTT 
5101 TTCTGCGCGT AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG 
5151 GTGGTTTGTT TGCCGGATCA AGAGC T AC C A ACTCTTTTTC C GAAGGT AAC 
5 2 01 TGGCTTCAGC AGAGC GC AGA TACCAAATAC TGTCCTTCTA GTGTAGCCGT 
5251 AGTTAGGCCA CCACTTCAAG AACTCTGTAG CACCGCCTAC ATACCTCGCT 
5301 CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA AGTCGTGTCT 
5351 TACCGGGTTG GACTCAAGAC GAT AGT TACC GGATAAGGCG CAGCGGTCGG 
5401 GCTGAACGGG GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC 
5451 ACCGAACTGA GAT ACC T AC A GCGTGAGCAT TGAGAAAGCG CCACGCTTCC 
5501 CGAAGGGAGA AAGGCGGACA GGTATCCGGT AAGCGGCAGG GTCGGAACAG 
5551 GAGAGC GC AC GAGGGAGCTT CCAGGGGGAA ACGCCTGGTA TCTTTATAGT 
5 601 CCTGTCGGGT TTCGCCACCT C T GACTT GAG CGTCGATTTT TGTGATGCTC 
5651 GTCAGGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG GCCTTTTTAC 
5701 GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA 
5751 TCCCCTGATT CT GTGGATAA CCGTATTACC GCCTTTGAGT GAGCTGATAC 
5801 CGCTCGCCGC AGCCGAACGA CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG 
5851 CGGAAG 



Tabelle 8: Nukleotidsequenz des rekombinanten Expressionsplasmids pCDNA3.1(-)H-SemaL-MycHlsA 

(SEQ ID NO.: 35) 

1 GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC 
51 TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT 
101 GGAGGTCGCT GAGT AGT GCG CGAGCAAAAT TTAAGCTACA ACAAGGCAAG 
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151 GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG 
201 CTGCTTCGCG ATGTACGGGC C AG AT AT AC G CGTTGACATT GAT T AT T GAC 
251 TAGTTATTAA TAGTAATCAA T T AC GGGGTC ATTAGTTCAT AGCCCATATA 
301 TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG 
351 CCCAACGACC CCCGCCCATT GAC GTCAAT A ATGACGTATG T TCCCATAGT 
401 AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT 
451 AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC 
501 CCTATTGACG TCAATGAC GG TAAATGGCCC GCCTGGCATT ATGCCCAGTA 
551 CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 
601 TCGCTATTAC CAT GGT GAT G CGGTTTTGGC AGTACATCAA TGGGCGTGGA 
651 TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA 
701 TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA 
751 ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG 
801 GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG 
851 GCTTATCGAA ATTAATACGA CTC AC TAT AG GGAGACCCAA GCTGGCTAGC 
901 GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT 
951 GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc 
1001 agcgcaccgc gcgcccgcgt ccctggcccg ccggctcggt tggggcttcc 
1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc 
1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat 
1151 gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct 
1201 tttccacgag ccaggcagct cctctgtgtg ggtgggagga cgtggcaagg 
1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgcacggtg 
1301 aatatcggct ccacaaaggg gtcctgtctg gataagcggg actgcgagaa 
1351 ctacatcact ctcctggaga ggcggagtga ggggctgctg gcctgtggca 
1401 ccaacgcccg gcaccccagc tgctggaacc tggtgaatgg cactgtggtg 
1451 ccacttggcg agatgagagg ctacgccccc ttcagcccgg acgagaactc 
1501 cctggttctg tttgaagggg acgaggtgta ttccaccatc cggaagcagg 
1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg cgagagtgag 
1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac 
1651 catcgtgcac caagaccagg cttacgatga caagatctac tacttcttcc 
1701 gagaggacaa tcctgacaag aatcctgagg ctcctctcaa tgtgtcccgt 
1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt 
1801 ctccaagtgg aacacttttc tgaaagccat gctggtatgc agtgatgctg 
1851 ccaccaacaa gaacttcaac aggctgcaag acgtcttcct gctccctgac 
1901 cccagcggcc agtggaggga caccagggtc tatggtgttt tctccaaccc 
1951 ctggaactac tcagccgtct gtgtgtattc cctcggtgac attgacaagg 
2001 tcttccgtac ctcctcactc aagggctacc actcaagcct tcccaacccg 
2051 cggcctggca agtgcctccc agaccagcag ccgataccca cagagacctt 



55 
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2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg 
2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg 
2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta 
2251 cctaactaca gacaggggca ctatccacaa ggtggtggaa ccgggggagc 
2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc 
2351 gcggctgcca tccagaccat gtcgctggat gctgagcgga ggaagctgta 
2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg 
2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc 
2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt 
2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca 
2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc 
2651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg 
2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca 
2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac 
2801 ttctgcgagg cccaggaggg ctcctacttc cgcgaggctc agcactggca 
2851 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct 
2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt 
2951 ggcttgctgg tccacgtgaa gcttGGGCCC GAACAAAAAC TCATCTCAGA 
3001 AGAGGATCTG AATAGCGCCG TCGACCATCA T CAT CAT CAT CATTGAGTTT 
3051 AAACCGCTGA TCAGCCTCGA CTGTGCCTTC TAGTTGCCAG CCATCTGTTG 
3101 TTTGCCCCTC CCCCGTGCCT TCCTTGACCC TGGAAGGTGC CACTCCCACT 
3151 GTCCTTTCCT AATAAAATGA GGAAAT TGCA TCGCATTGTC TGAGTAGGTG 
3201 TCATTCTATT CTGGGGGGTG GGGTGGGGCA GGACAGCAAG GGGGAGGATT 
3251 GGGAAGACAA TAGCAGGCAT GCTGGGGATG CGGTGGGCTC TATGGCTTCT 
3301 GAGGCGGAAA GAACCAGCTG GGGCTCTAGG GGGTATCCCC ACGCGCCCTG 
3351 TAGCGGCGCA TTAAGCGCGG CGGGTGTGGT GGTTACGCGC AGCGTGACCG 
3401 CTACACTTGC CAGCGCCCTA GCGCCCGCTC CTTTCGCTTT CTTCCCTTCC 
3 451 TTTCTCGCCA CGTTCGCCGG CTTTCCCCGT CAAGCTCTAA AT C GGGGCAT 
3501 CCCTTTA GGG TTCCGATTTA GTGCTTTACG GCACCTCGAC CCCAAAAAAC 
3551 TTGATTAGGG TGATGGTTCA CGTAGTGGGC CATCGCCCTG ATAGACGGTT 
3601 TTTCGCCCTT TGACGTTGGA GTCCACGTTC TTTAATAGTG GACTCTTGTT 
3 651 CCAAACTGGA ACAACACTCA ACCCTATCTC GGTCTATTCT TTTGATTTAT 
3701 AAGGGATTTT GGGGATTTCG GCCTATTGGT TAAAAAATGA GCTGATTTAA 
3751 CAAAAATTTA ACGCGAATTA ATTCTGTGGA ATGTGTGTCA GTTAGGGTGT 
3 801 GGAAAGTCCC CAGGCTCCCC AGGCAGGCAG AAGTATGCAA AGCATGCATC 
3851 TCAATTAGTC AGCAACCAGG TGTGGAAAGT CCCCAGGCTC CCCAGCAGGC 
3901 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA TAGTCCCGCC 
3951 CCTAACTCCG CCCATCCCGC CCCTAACTCC GCCCAGTTCC GCCCATTCTC 
4001 CGCCCCATGG CTGACTAATT TTTTTTATTT AT GC AGAGGC CGAGGCCGCC 
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4051 TCTGCCTCTG AGO T AT T CCA GAAGTAGTGA GGAGGCTTTT TTGGAGGCCT 
4101 AGGCTTTTGC AAAAAGCTCC CGGGAGCTTG TATATCCATT TTCGGATCTG 
5 4151 ATCAAGAGAC AGGATGAGGA TCGTTTCGCA TGATTGAACA AGATGGATTG 

4201 CACGCAGGTT CTCCGGCCGC TTGGGTGGAG AGGCTATTCG GCTATGACTG 
4251 GGCACAACAG ACAATCGGCT GCTCTGATGC CGCCGTGTTC CGGCTGTCAG 
4301 CGCAGGGGCG CCCGGTTCTT TTTGTCAAGA CCGACCTGTC CGGTGCCCTG 
10 4351 AATGAACTGC AGGACGAGGC AGCGCGGCTA TCGTGGCTGG CCACGACGGG 

4401 CGTTCCTTGC GCAGCTGTGC TCGACGTTGT CACTGAAGCG GGAAGGGACT 
4451 GGCTGCTATT GGGCGAAGTG CCGGGGCAGG ATCTCCTGTC ATCTCACCTT 
4501 GCTCCTGCCG AGAAAGT ATC CATCATGGCT GATGCAATGC GGCGGCTGCA 

15 4551 tacgcttgat ccggctacct gcccattcga ccaccaagcg AAACATCGCA 

4601 tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat 
4651 ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct 

4 ^ 0 1 CAAGGCGCGC ATGCCCGACG GCGAGGATCT CGTCGTGACC CATGGCGATG 
4751 CCTGCTTGCC GAATATCATG GTGGAAAATG GCCGCTTTTC TGGATTCATC 
4801 GACTGTGGCC GGCTGGGTGT GGCGGACCG C TATCAGGACA TAGCGTTGGC 
4851 TACCCGTGAT ATTGCTGAAG AGCTTGGCGG CGAATGGGCT GACCGCTTCC 

25 4901 tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 

4951 CGCCTTCTTG ACGAGTTCTT CTGAGCGGGA CTCTGGGGTT CGAAATGACC 

5001 GACCAAGCGA CGCCCAACCT GCCATCACGA GATTTCGATT CCACCGCCGC 

5051 CTTCTAT GAA AGGTTGGGCT TCGGAATCGT TTTCCGGGAC GCCGGCTGGA 

30 5101 TGATCCTCCA GCGCGGGGAT CTCATGCTGG AGTTCTTCGC CCACCCCAAC 

5151 TTGTTTATTG CAGCTTATAA TGGTTACAAA TAAAGCAATA GCATCACAAA 

5201 TTTCACAAAT AAAGCATTTT TTTCACTGCA TTCTAGTTGT GGTTTGTCCA 

5251 AAC T CAT CAA TGTATCTTAT CATGTCTGTA TACCGTCGAC CTCTAGCTAG 

5301 AGCTTGGCGT AATCATGGTC ATAGCTGTTT CCTGTGTGAA ATTGTTATCC 

5351 GCTCACAATT CCACACAACA TACGAGCCGG AAGCATAAAG TGTAAAGCCT 

5401 GGGGTGCCTA ATGAGT GAGC TAACTCACAT TAATTGCGTT GCGCTCACTG 

5451 CCCGCTTTCC AGTCGGGAAA CCTGTCGTGC CAGCTGCATT AATGAATCGG 
40 

5501 CCAACGCGCG GGGAGAGGCG GTTTGCGTAT TGGGCGCTCT TCCGCTTCCT 
5551 CGCTCACTGA CTCGCTGCGC TCGGTCGTTC GGCTGCGGCG AGCGGTATCA 
5601 GC T C AC T CAA AGGCGGTAAT ACGGTTATCC ACAGAATCAG GG GAT AAC GC 
45 5651 AGGAAAGAAC AT GT GAGC AA AAGGCCAGCA AAAGGCCAGG AACCGTAAAA 

5701 AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC TGACGAGCAT 
5751 CACAAAAATC GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA 
5801 AAGATACCAG GCGTTTCCCC CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC 
50 5851 CGACCCTGCC GCTTACCGGA TACCTGTCCG CCTTTCTCCC TTCGGGAAGC 

5901 GTGGCGCTTT CTCAATGCTC ACGCTGTAGG TATCTCAGTT CGGTGTAGGT 
5951 CGTTCGCTCC AAGCTGGGCT GTGTGCACGA ACCCCCCGTT CAGCCCGACC 
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6001 GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGTAAGACAC 

6051 GACTTATCGC CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG 

5 6101 GTATGTAGGC GGTGCTACAG AGTTCTTGAA GTGGTGGCCT AACTACGGCT 

6151 ACACTAGAAG GACAGTATTT GGTATCTGCG CTCTGCTGAA GCCAGTTACC 

6201 TTCGGAAAAA GAGTTGGTAG CTCTTGATCC GGCAAACAAA CCACCGCTGG 

6251 TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA GATTACGC GC AGAAAAAAAG 

10 6301 GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG 

6351 AACGAAAACT CACGTTAAGG GATTTTGGTC ATGAGATTAT CAAAAAGGAT 

6401 CTTCACCTAG ATCCTTTTAA ATTAAAAATG AAGTTTTAAA TCAATCTAAA 

6451 GTATATATGA GTAAACTTGG TCTGACAGTT ACCAATGCTT AATCAGTGAG 

15 6501 GCACCTATCT CAGCGATCTG TCTATTTCGT TCATCCATAG TTGCCTGACT 

6551 CCCCGTCGTG TAGATAACTA CGATACGGGA GGGCTTACCA TCTGGCCCCA 

6601 GTGCTGCAAT GATACCGCGA GACCCACGCT CACCGGCTCC AGATTTATCA 

6651 GCAATAAACC AGCCAGCCGG AAGGGCCGAG CGCAGAAGTG GTCCTGCAAC 

20 6701 TTTATCCGCC TCCATCCAGT CTATTAATTG TTGCCGGGAA GCTAGAGTAA 

6751 GTAGTTCGCC AGTTAATAGT TTGCGCAACG TTGTTGCCAT T GCTACAGGC 

6801 ATCGTGGTGT CACGCTCGTC GTTTGGTATG GCTTCATTCA GCTCCGGTTC 

6851 CCAACGATCA AGGCGAGTTA CATGATCCCC CATGTTGTGC AAAAAAGCGG 

6901 TTAGCTCCTT CGGTCCTCCG ATCGTTGTCA GAAGTAAGTT GGCCGCAGTG 

6951 TTATCACTCA TGGTTATGGC AGCACTGCAT AATTCTCTTA CTGTCATGCC 

7001 ATCCGTAAGA TGCTTTTCTG TGACTGGTGA GTACTCAACC AAGTCATTCT 

7051 GAGAATAGTG TATGCGGCGA CCGAGTTGCT CTTGCCCGGC GTCAATACGG 
30 

7101 GATAATACCG C GCCACAT AG CAGAACTTTA AAAGTGCTCA TCATTGGAAA 
7151 ACGTTCTTCG GGGCGAAAAC TCTCAAGGAT CTTACCGCTG TTGAGATCCA 
7201 GTTCGATGTA ACCCACTCGT GCACCCAACT GATCTTCAGC ATCTTTTACT 
35 7251 TTCACCAGCG TTTCTGGGTG AGCAAAAACA GGAAGGCAAA ATGCCGCAAA 

7301 AAAGGGAATA AGGGCGACAC GGAAATGTTG AATACTCATA CTCTTCCTTT 
7351 TTCAATATTA TTGAAGCATT TATCAGGGTT ATTGTCTCAT GAGCGGATAC 
7401 ATATTTGAAT GTATTTAGAA AAATAAACAA ATAGGGGTTC CGCGCACATT 
i0 7451 TCCCCGAAAA GTGCCACCTG ACGTC 
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Tabelle 9: Nukleotidsequenz des rekombinanten Plasmids pcONA 3 . 1 -H-SemaL-EGF P-Mych isA 



(SEQ ID NO.: 36) 



1 GACGGATCGG GAGATCTCCC GATCCCCTAT 
51 TGCTCTGATG CCGCATAGTT AAGCCAGTAT 
101 GGAGGTCGCT GAGTAGTGCG CGAGCAAAAT 
151 GCTTGACCGA CAATTGCATG AAGAATCTGC 
201 CTGCTTCGCG ATGTACGGGC CAGATATACG 



GGTCGACTCT CAGTACAATC 
CTGCTCCCTG CTTGTGTGTT 
TTAAGCTACA ACAAGGCAAG 
TTAGGGTTAG GCGTTTTGCG 
CGTTGACATT GATTATTGAC 
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251 TAGTTATTAA TAGTAATCAA TTACGGGGTC ATT AG T T CAT AGCCCATATA 
301 TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG 
351 CCCAACGACC CCCGCCCATT GACGTCAATA AT GACGT AT G TTCCCATAGT 
401 AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT 
451 AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC 
501 CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT AT GCCCAGT A 
551 CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 
601 TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA 
651 TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA 
701 TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA 
751 ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG 
801 GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG 
851 GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 
901 GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CT GGATATCT 
951 GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc 
1001 agcgcaccgc gcgcccgcgt ccctggcccg ccggctcggt tggggcttcc 
1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc 
1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat 
1151 gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct 
1201 tttccacgag ccaggcagct cctctgtgtg ggtgggagga cgtggcaagg 
1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgcacggtg 
1301 aatatcggct ccacaaaggg gtcctgtctg gataagcggg actgcgagaa 
1351 ctacatcact ctcctggaga ggcggagtga ggggctgctg gcctgtggca 
1401 ccaacgcccg gcaccccagc tgctggaacc tggtgaatgg cactgtggtg 
1451 ccacttggcg agatgagagg ctacgccccc ttcagcccgg acgagaactc 
1501 cctggttctg tttgaagggg acgaggtgta ttccaccatc cggaagcagg 
1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg cgagagtgag 
1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac 
1651 catcgtgcac caagaccagg cttacgatga caagatctac tacttcttcc 
1701 gagaggacaa tcctgacaag aatcctgagg ctcctctcaa tgtgtcccgt 
1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt 
1801 ctccaagtgg aacacttttc tgaaagccat gctggtatgc agtgatgctg 
1851 ccaccaacaa gaacttcaac aggctgcaag acgtcttcct gctccctgac 
1901 cccagcggcc agtggaggga caccagggtc tatggtgttt tctccaaccc 
1951 ctggaactac tcagccgtct gtgtgtattc cctcggtgac attgacaagg 
2001 tcttccgtac ctcctcactc aagggctacc actcaagcct tcccaacccg 
2051 cggcctggca agtgcctccc agaccagcag ccgataccca cagagacctt 
2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg 
2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg 
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2201 


gccgttcacc 


gcatgcaagc 


cagccacggg 


gagacctttc 


atgtgcttta 




2251 


cctaactaca 


gacaggggca 


ctatccacaa 


ggtggtggaa 


ccgggggagc 


5 


2301 


aggagcacag 


cttcgccttc 


aacatcatgg 


agatccagcc 


cttccgccgc 




2351 


gcggctgcca 


tccagaccat 


gtcgctggat 


gctgagcgga 


ggaagctgta 




2401 


tgtgagctcc 


cagtgggagg 


tgagccaggt 


gcccctggac 


ctgtgtgagg 




2451 


tctatggcgg 


gggctgccac 


ggttgcctca 


tgtcccgaga 


cccctactgc 


10 


2501 


ggctgggacc 


agggccgctg 


catctccatc 


tacagctccg 


aacggtcagt 




2551 


gctgcaatcc 


attaatccag 


ccgagccaca 


caaggagtgt 


cccaacccca 




2601 


aaccagacaa 


ggccccactg 


cagaaggttt 


ccctggcccc 


aaactctcgc 




2651 


tactacctga 


gctgccccat 


ggaatcccgc 


cacgccacct 


actcatggcg 


15 


2701 


ccacaaggag 


aacgtggagc 


agagctgcga 


acctggtcac 


cagagcccca 




2751 


actgcatcct 


gttcatcgag 


aacctcacgg 


cgcagcagta 


cggccactac 




2801 


ttctgcgagg 


cccaggaggg 


ctcctacttc 


cgcgaggctc 


agcactggca 




2851 


gctgctgccc 


gaggacggca 


tcatggccga 


gcacctgctg 


ggtcatgcct 


20 


2901 


gtgccctggc 


tgcctccctc 


tggctggggg 


tgctgcccac 


actcactctt 




2951 


ggcttgctgg 


tccacATGGT 


GAGCAAGGGC 


GAGGAGCTGT 


TCACC GGGGT 




3001 


GGTGCCCATC 


CTGGTCGAGC 


TGGACGGCGA 


CGTAAACGGC 


CACAAGTTCA 




3051 


GCGTGTCCGG 


CGAGGGCGAG 


GGCGATGCCA 


CCT AC GGC AA 


GCTGACCCTG 


25 


3101 


AAGTTCATCT 


GCACCACCGG 


CAAGCTGCCC 


GTGCCCTGGC 


CCACCC TCGT 




3151 


GACCACCCTG 


ACCTACGGCG 


TGCAGTGCTT 


CAGCCGCTAC 


CCCGACCACA 




3201 


TGAAGCAGCA 


CGACTTCTTC 


AAGTCCGCCA 


TGCCCGAAGG 


CTACGTCCAG 


30 


3251 


GAGCGCACCA 


TCTTCTTCAA 


GGACGACGGC 


AACTACAAGA 


CCCGCGCCGA 


3301 


GGTGAAGTTC 


GAGGGCGACA 


CCCTGGTGAA 


CCGCATCGAG 


CT GAAGGGC A 




3351 


TCGACTTCAA 


GGAGGAC GGC 


AACATCCTGG 


GGCACAAGCT 


GGAGTACAAC 




3401 


TACAACAGCC 


ACAACGTCTA 


TATCATGGCC 


GACAAGCAGA 


AGAAC GGC AT 


35 


3451 


CAAGGT GAAC 


TTCAAGATCC 


GCCACAACAT 


CGAGGACGGC 


AGC GT GC AGC 




3501 


TCGCCGACCA 


CTACCAGCAG 


AACACCCCCA 


TCGGCGACGG 


CCCCGTGCTG 




3551 


CTGCCCGACA 


ACCACTACCT 


GAGCACCCAG 


TCCGCCCTGA 


GCAAAGACCC 




3601 


CAACGAGAAG 


CGCGATCACA 


TGGTCCTGCT 


GGAGTTCGTG 


ACCGCCGCCG 


40 


3651 


GGATCACTCT 


CGGCATGGAC 


GAGCTGTACA 


Aggtgaagct 


tGGGCCCGAA 




3701 


CAAAAACTCA 


TCTCAGAAGA 


GGATCTGAAT 


AGCGCCGTCG 


ACC AT CATC A 




3751 


TCATCATCAT 


TGAGTTTAAA 


CCGCTGATCA 


GCCTCGACTG 


TGCCTTCTAG 




3801 


TTGCCAGCCA 


TCTGTTGTTT 


GCCCCTCCCC 


CGTGCCTTCC 


TTGACCCTGG 


45 


3851 


AAGGT GC C AC 


TCCCACTGTC 


CTTTCCTAAT 


AAAAT GAGGA 


AATTGCATCG 




3901 


CATTGTCTGA 


GTAGGTGTCA 


TTCTATTCTG 


GGGGGT GGGG 


T GGGGCAGGA 




3951 


CAGCAAGGGG 


GAG GAT T GG G 


AAGACAATAG 


CAGGCATGCT 


GGGGATGCGG 




4001 


TGGGCTCTAT 


GGCTTCTGAG 


GCGGAAAGAA 


CCAGCT GGGG 


C TCT AGGGGG 


50 


4051 


TATCCCCACG 


CGCCCTGTAG 


CGGCGCATTA 


AGCGCGGCGG 


GTGTGGTGGT 




4101 


T AC GC GC AGC 


GTGACCGCTA 


CACTTGCCAG 


CGCCCTAGCG 


CCCGCTCCTT 
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4151 


TCGCTTTCTT 


CCCTTCCTTT 


CTCGCCACGT 


TCGCCGGCTT 


TCCCCGTCAA 




4201 


GCTCTAAATC 


GGGGCATCCC 


TTTAGGGTTC 


CGATTTAGTG 


CTTTACGGCA 


5 


4251 


CCTCGACCCC 


AAAAAACTTG 


AT T AGGGT GA 


TGGTTCACGT 


AGT GGGC CAT 




4301 


CGCCCTGATA 


GACGGTTTTT 


CGCCCTTTGA 


CGTTGGAGTC 


CACGTTCTTT 




4351 


AATAGTGGAC 


TCTTGTTCCA 


AACT GGAACA 


ACACTCAACC 


CTATCTCGGT 




4401 


CTATTCTTTT 


GATT TAT AAG 


GGATTTTGGG 


GAT TTCGGCC 


TATTGGTTAA 


10 


4451 


AAAAT GAGCT 


GATTTAACAA 


AAAT TTAACG 


CGAATTAATT 


CTGTGGAATG 




4501 


TGTGTCAGTT 


AGGGTGT GGA 


AAGTCCCCAG 


GCTCCCCAGG 


CAGGCAGAAG 




4551 


TATGCAAAGC 


ATGCATCTCA 


ATTAGTCAGC 


AACCAGGTGT 


GGAAAGTCCC 




4601 


CAGGCTCCCC 


AGCAGGCAGA 


AGTATGCAAA 


GCATGCATCT 


CAATTAGTCA 


15 


4651 


GCAACCATAG 


TCCCGCCCCT 


AACTCCGCCC 


ATCCCGCCCC 


TAACTCCGCC 




4701 


CAGTTC CGCC 


CATTCTCCGC 


CCCATGGCTG 


ACTAATTTTT 


TTTATTTATG 




4751 


CAGAGGCCGA 


GGCCGCCTCT 


GCCTCTGAGC 


TATTCCAGAA 


GTAGTGAGGA 




4801 


GGCTTTTTTG 


GAGGCC T AGG 


CTTTTGCAAA 


AAGCTCCCGG 


GAGCTTGTAT 


20 


4851 


ATCCATTTTC 


GGATCTGATC 


AAGAGACAGG 


ATGAGGATCG 


TTTCGCATGA 




4901 


TTGAACAAGA 


TGGATTGCAC 


GCAGGTTCTC 


CGGCCGCTTG 


GGTGGAGAGG 




4951 


CTATTCGGCT 


AT G ACT GGGC 


ACAACAGACA 


ATCGGCTGCT 


CTGATGCCGC 


25 


5001 


CGTGTTCCGG 


CTGTCAGCGC 


AGGGGCGCCC 


GGTTCTTTTT 


GTCAAGACCG 


5051 


ACCTGTCCGG 


TGCCCTGAAT 


GAAC T GCAGG 


ACGAGGCAGC 


GCGGCTATCG 




5101 


TGGCTGGCCA 


C GAC GGGCGT 


TCCTTGCGCA 


GCTGTGCTCG 


ACGTTGTCAC 




5151 


TGAAGCGGGA 


AGGGACTGGC 


TGCTATTGGG 


CGAAGTGCCG 


GGGCAGGATC 


30 


5201 


TCCTGTCATC 


TCACCTTGCT 


CCTGCCGAGA 


AAGT AT C CAT 


CATGGCTGAT 


5251 


GCAAT GCGGC 


GGCTGCATAC 


GCTTGATCCG 


GCTACCTGCC 


CATTCGACCA 




5301 


CCAAGCGAAA 


CATCGCATCG 


AGCGAGCACG 


TACTCGGATG 


GAAGCCGGTC 




5351 


TTGTCGATCA 


GGATGATCTG 


GACGAAGAGC 


ATCAGGGGCT 


CGCGCCAGCC 


35 


5401 


GAACTGTTCG 


CCAGGCTCAA 


GGCGCGCATG 


CCCGACGGCG 


AGGATCTCGT 




5451 


CGTGACCCAT 


GGC GAT GCCT 


GCTTGCCGAA 


TATCATGGTG 


GAAAAT GGCC 




5501 


GCTTTTCTGG 


ATTCATCGAC 


TGTGGCCGGC 


TGGGTGTGGC 


GGACCGCTAT 




5551 


CAGGACATAG 


CGTTGGCTAC 


CCGTGATATT 


GCTGAAGAGC 


TTGGCGGCGA 


40 


5601 


ATGGGCTGAC 


CGCTTCCTCG 


TGCTTTACGG 


TATCGCCGCT 


CCCGATTCGC 




5651 


AGCGCATCGC 


CTTCTATCGC 


CTTCTTGACG 


AGTTCTTCTG 


AGCGGGACTC 




5701 


TGGGGTTCGA 


AATGACCGAC 


CAAGCGACGC 


CCAACCTGCC 


ATCACGAGAT 




5751 


TTCGATTCCA 


CCGCCGCCTT 


CTATGAAAGG 


TTGGGCTTCG 


GAATCGTTTT 


45 


5801 


CCGGGACGCC 


GGCTGGATGA 


TCCTCCAGCG 


CGGGGATCTC 


ATGCTGGAGT 




5851 


TCTTCGCCCA 


CCCCAACTTG 


TTTATTGCAG 


CTTATAATGG 


TTACAAATAA 




5901 


AGCAATAGCA 


TCACAAATTT 


C AC AAAT AAA 


GCATTTTTTT 


C ACT GCAT TC 


50 


5951 


TAGTTGTGGT 


TTGTCCAAAC 


TCATCAATGT 


ATCTTATCAT 


GTCTGTATAC 


6001 


CGTCGACCTC 


TAGCTAGAGC 


TTGGCGTAAT 


CATGGTCATA 


GCTGTTTCCT 




6051 


GTGTGAAATT 


GTTATCCGCT 


CACAATTCCA 


CACAACATAC 


GAGCCGGAAG 
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6101 CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA CTCACATTAA 
6151 TTGCGTTGCG CTCACTGCCC GCTTTCCAGT CGGGAAACCT GTCGTGCCAG 
6201 CTGCATTAAT GAATCGGCC A ACGC GCGGGG AGAGGCGGTT TGCGTATT GG 
6251 GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG GTCGTTCGGC 
6301 TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG GT T ATCCACA 
6351 GAATCAGGGG ATAACGCAGG AAAGAAC AT G TGAGCAAAAG GCCAGCAAAA 
6401 GGCCAGGAAC CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC 
6451 GCCCCCCTGA C GAGCAT C AC AAAAATC GAC GCTCAAGTCA GAGGTGGCGA 
6501 AACCC GAC AG GAC T AT AAAG ATACCAGGCG TTTCCCCCTG GAAGCTCCCT 
6551 CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT TACCGGATAC CTGTCCGCCT 
6601 TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC AATGCTCACG CTGTAGGTAT 
6651 CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC 
6701 CCCCGTTCAG CCCGACCGCT GCGCCTTATC CGGTAACTAT CGTCTTGAGT 
6751 CCAACCCGGT AAGAC AC GAC TTATCGCCAC TGGCAGCAGC CACTGGTAAC 
6801 AGGATTAGCA GAGCGAGGTA TGTAGGCGGT GCTACAGAGT TCTTGAAGTG 
6851 GTGGCCTAAC TACGGCTACA C T AGAAGGAC AGTATTTGGT ATCTGCGCTC 
6901 TGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCCGGC 
6951 AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT 
7001 TACGCGCAGA AAAAAAGGAT CTCAAGAAGA TCCTTTGATC TTTTCTACGG 
7051 GGTCTGACGC TCAGTGGAAC GAAAACTCAC GTTAAGGGAT TTTGGTCATG 
7101 AGATTATCAA AAAGGATCTT CACCTAGATC CTTTTAAATT AAAAATGAAG 
7151 TTTTAAATCA ATCTAAAGTA TATATGAGTA AACTTGGTCT GACAGTTACC 
7201 AATGCTTAAT CAGTGAGGCA CCTATCTCAG CGATCTGTCT ATTTCGTTCA 
7251 TCCATAGTTG CCTGACTCCC CGTCGTGTAG ATAACTACGA T AC GGGAGGG 
7301 CTTACCATCT GGCCCCAGTG CT GCAATGAT ACCGCGAGAC CCACGCTCAC 
7351 CGGCTCCAGA TTTATCAGCA ATAAACCAGC CAGCCGGAAG GGCCGAGCGC 
7401 AGAAGTGGTC CTGCAACTTT ATCCGCCTCC ATCCAGTCTA TTAATTGTTG 
7451 CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT TAATAGTTTG CGCAACGTTG 
7501 TTGCCATTGC TACAGGCATC GTGGTGTCAC GCTCGTCGTT TGGTATGGCT 
7551 TCATTCAGCT CCGGTTCCCA ACGATCAAGG CGAGTTACAT GATCCCCCAT 
7601 GTTGTGCAAA AAAGCGGTTA GCTCCTTCGG TCCTCCGATC GTTGTCAGAA 
7 651 GTAAGTTGGC CGCAGTGTTA TCACTCAT GG TTATGGCAGC ACTGCATAAT 
7701 TCTCTTACTG TCATGCCATC CGTAAGATGC TTTTCTGTGA CTGGTGAGTA 
7751 CTCAACCAAG TCATTCTGAG AATAGTGTAT GCGGCGACCG AGTTGCTCTT 
7 801 GCCCGGCGTC AATACGGGAT AATACCGCGC CACATAGCAG AACTTTAAAA 
7851 GTGCTCATCA TTGGAAAACG TTCTTCGGGG CGAAAACTCT CAAGGATCTT 
7901 ACCGCTGTTG AGATCCAGTT CGATGTAACC CACTCGTGCA CCCAACTGAT 
7 951 CTTCAGCATC TTTTACTTTC ACCAGCGTTT CTGGGTGAGC AAAAACAGGA 
8001 AGGCAAAATG CCGCAAAAAA GGGAATAAGG GCGACACGGA AATGTTGAAT 




EP 0 892 047 A2 



8051 ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT CAGGGTTATT 
8101 GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA 
5 8151 GGGGTTCCGC GCACATTTCC CCGAAAAGTG CCACCTGACG TC 
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Tabelle 10: Nukleotidsequenz des rekombinanten Plasmids pIND-H-SemaL-EE (SEQ ID NO.: 37) 

1 AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT 
51 TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC 
101 GAT GGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT 
151 TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG 
201 TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC 
251 AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 
301 GAACAAGCTA AACAATCTGC AGT AAAGTGC AAGTTAAAGT GAATCAATTA 
351 AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA 
401 GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT 
451 ACCGAGAAAG AAGAACTCAC ACACAGCTAG CGTTTAAACT TAAGCTTGGT 
501 ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga 
551 cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc 
601 cctggcccgc cggctcggtt ggggcttccg ctgcggctgc ggctgctgct 
651 gctgctctgg gcggccgccg cctccgccca gggccaccta aggagcggac 
701 cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac 
751 tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc 
801 ctctgtgtgg gtgggaggac gtggcaaggt ctacctcttt gacttccccg 
851 agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg 
901 tcctgtctgg ataagcggga ctgcgagaac tacatcactc tcctggagag 
951 gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct 
1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc 
1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggga 
1101 cgaggtgtat tccaccatcc ggaagcagga atacaatggg aagatccctc 
1151 ggttccgccg catccggggc gagagtgagc tgtacaccag tgatactgtc 
1201 atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc 
1251 ttacgatgac aagatctact acttcttccg agaggacaat cctgacaaga 
1301 atcctgaggc tcctctcaat gtgtcccgtg tggcccagtt gtgcaggggg 
1351 gaccagggtg gggaaagttc actgtcagtc tccaagtgga acacttttct 
1401 gaaagccatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca 
1451 ggctgcaaga cgtcttcctg ctccctgacc ccagcggcca gtggagggac 
1501 accagggtct atggtgtttt ctccaacccc tggaactact cagccgtctg 
1551 tgtgtattcc ctcggtgaca ttgacaaggt cttccgtacc tcctcactca 
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1601 agggctacca ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca 
1651 gaccagcagc cgatacccac agagaccttc caggtggctg accgtcaccc 
1701 agaggtggcg cagagggtgg agcccatggg gcctctgaag acgccattgt 
1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc 
1801 agccacgggg agacctttca tgtgctttac ctaactacag acaggggcac 
1851 tatccacaag gtggtggaac cgggggagca ggagcacagc ttcgccttca 
1901 acatcatgga gatccagccc ttccgccgcg cggctgccat ccagaccatg 
1951 tcgctggatg ctgagcggag gaagctgtat gtgagctccc agtgggaggt 
2001 gagccaggtg cccctggacc tgtgtgaggt ctatggcggg ggctgccacg 
2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc 
2101 atctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc 
2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc 
2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg 
2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca 
2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga 
2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc 
2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat 
2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct 
2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag 
2551 cttG GGCCCG TTTAAACCCG CTGATCAGCC TCGACTGTGC CTTCTAGTTG 
2601 CCAGCCATCT GTTGTTTGCC CCTCCCCCGT GCCTTCCTTG ACCCTGGAAG 
2 651 GTGCCACTCC CACTGTCCTT TCCTAATAAA AT GAGGAAAT TGCATCGCAT 
2701 TGTCTGAGTA GGTGTCATTC TATTCTGGGG GGTGGGGTGG GGCAGGACAG 
2751 CAAGGGGGAG GATTGGGAAG ACAATAGCAG GCATGCTGGG GATGCGGTGG 
2 801 GCTCTATGGC TTCTGAGGCG G AAAGAAC C A GCTGGGGCTC TAGGGGGTAT 
2851 CCCCACGCGC CCTGTAGCGG CGCATTAAGC GCGGCGGGTG TGGTGGTTAC 
2901 GCGCAGCGTG ACCGCTACAC TTGCCAGCGC CCTAGCGCCC GCTCCTTTCG 
2951 CTTTCTTCCC TTCCTTTCTC GCCACGTTCG CCGGCTTTCC CCGTCAAGCT 
3001 CTAAATCGGG GCATCCCTTT AGGGTTCCGA TTTAGTGCTT TACGGCACCT 
3051 CGACCCCAAA AAACTTGATT AGGGTGATGG TTCACGTAGT GGGCCATCGC 
3101 CCTGATAGAC GG TTTTTCGC CCTTTGACGT TGGAGTCCAC GTTCTTTAAT 
3151 AGTGGACTCT TGT TCCAAAC TGGAACAACA CTCAACCCTA TCTCGGTCTA 
3201 TTCTTTTGAT TTATAAGGGA TTTTGGGGAT TTCGGCCTAT TGGTTAAAAA 
3251 AT GAGCT GAT TTAACAAAAA TTTAACGCGA ATTAATTCTG TGGAATGTGT 
3301 GTCAGTTAGG GTGTGGAAAG TCCCCAGGCT CCCCAGGCAG GCAGAAGTAT 
3351 GCAAAGCATG CATCTCAATT AGTCAGCAAC CAGGT GTGGA AAGTCCCCAG 
3401 GCTCCCCAGC AGGCAGAAGT AT GC AAA GCA TGCATCTCAA TTAGTCAGCA 
3451 ACCATAGTCC CGCCCCTAAC TCCGCCCATC CCGCCCCTAA CTCCGCCCAG 
3501 TTCCGCCCAT TCTCCGCCCC ATGGCTGACT AATTTTTTTT ATTTATGCAG 







3551 


AGGCCGAGGC 
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CGCCTCTGCC TCTGAGCTAT 


TCCAGAAGTA 


GTGAGGAGGC 




3601 


TTTTTTGGAG 


GCCTAGGCTT 


TTGCAAAAAG 


CTCCCGGGAG 


CTTGTATATC 


5 


3651 


CATTTTCGGA 


TCTGATCAAG 


AGACAGGATG 


AGGATCGTTT 


CGCATGATTG 




3701 


AACAAGATGG 


ATTGCACGCA 


GGTTCTCCGG 


CCGCTTGGGT 


GGAGAGGC T A 




3751 


TTCGGCTATG 


ACTGGGCACA 


ACAGACAATC 


GGCTGCTCTG 


ATGCCGCCGT 




3801 


GTTCCGGCTG 


TCAGCGCAGG 


GGCGCCCGGT 


TCTTTTTGTC 


AAGACCGACC 


10 


3851 


TGTCCGGTGC 


CCTGAATGAA 


CTGCAGGACG 


AGGCAGCGCG 


GCTATCGTGG 




3901 


CTGGCCACGA 


CGGGCGTTCC 


TTGCGCAGCT 


GTGCTCGACG 


TTGTCACTGA 




3951 


AGC GGGAAGG 


GACTGGCTGC 


TATTGGGCGA 


AGTGCCGGGG 


CAGGATCTCC 




4001 


TGTCATCTCA 


CCTTGCTCCT 


GCCGAGAAAG 


TAT CC AT CAT 


GGCTGATGCA 


15 


4051 


ATGCGGCGGC 


TGCATACGCT 


TGATCCGGCT 


ACCTGCCCAT 


TCGACCACCA 




4101 


AGC GAAACAT 


CGCATCGAGC 


GAGCACGTAC 


TCGGATGGAA 


GCCGGTCTTG 




4151 


TC GAT CAGGA 


TGATCTGGAC 


GAAGAGCAT C 


AGGGGCTCGC 


GCCAGCCGAA 




4201 


CTGTTCGCCA 


GGCTCAAGGC 


GCGCATGCCC 


GACGGCGAGG 


ATCTCGTCGT 


20 


4251 


GACCCATGGC 


GATGCCTGCT 


T GCCGAAT AT 


CATGGTGGAA 


AATGGCCGCT 




4301 


TTTCTGGATT 


CATCGACTGT 


GGCCGGCTGG 


GTGTGGCGGA 


CCGCTATCAG 




4351 


GACATAGCGT 


TGGCTACCCG 


TGATATTGCT 


GAAGAGC TTG 


GCGGCGAATG 




4401 


GGCTGACCGC 


TTCCTCGTGC 


TTTACGGTAT 


CGCCGCTCCC 


GATTCGCAGC 


25 


4451 


GCATCGCCTT 


CTATCGCCTT 


CTTGACGAGT 


TCTTCTGAGC 


GGGACTCTGG 




4501 


GGTTCGAAAT 


GACCGACCAA 


GCGACGCCCA 


ACCT GCCATC 


ACGAGATTTC 




4551 


GAT T CC ACC G 


CCGCCTTCTA 


T GAAAGGT T G 


GGCTTCGGAA 


TCGTTTTCCG 


30 


4601 


GGACGCCGGC 


TGGATGATCC 


TCCAGCGCGG 


GGATCTCATG 


CTGGAGTTCT 


4651 


TCGCCCACCC 


CAACTTGTTT 


ATTGCAGCTT 


ATAATGGT TA 


CAAATAAAGC 




4701 


AATAGCATCA 


CAAATTTCAC 


AAATAAAGCA 


TTTTTTTCAC 


TGCATTCTAG 




4751 


TTGTGGTTTG 


TCCAAACTCA 


TCAATGTATC 


TTATCATGTC 


TGTATACCGT 


35 


4801 


CGACCTCTAG 


CTAGAGCTTG 


GCGTAATCAT 


GGTCATAGCT 


GTTTCCTGTG 


4851 


TGAAATTGTT 


ATCCGCTCAC 


AATTCCACAC 


AAC AT AC GAG 


CCGGAAGCAT 




4901 


AAAGTGTAAA 


GCCTGGGGTG 


CCTAATGAGT 


GAGCTAACTC 


ACATTAATT G 




4951 


CGTTGCGCTC 


ACTGCCCGCT 


TTCCAGTCGG 


GAAACCTGTC 


GTGCCAGCTG 


40 


5001 


CATTAATGAA 


TCGGCCAACG 


CGCGGGGAGA 


GGCG GTTTGC 


GTATTGGGCG 




5051 


CTCTTCCGCT 


TCCTCGCTCA 


CTGACTCGCT 


GCGCTCGGTC 


GTTCGGCTGC 




5101 


GGCGAGCGGT 


ATCAGCTCAC 


TCAAAGGCGG 


TAATACGGTT 


ATCCACAGAA 




5151 


TCAGGGGATA 


ACGCAGGAAA 


GAACATGTGA 


GCAAAAGGCC 


AGCAAAAGGC 


45 


5201 


CAGGAACCGT 


AAAAAGGCCG 


CGTTGCTGGC 


GTTTTTCCAT 


AGGCTCCGCC 




5251 


CCCCTGACGA 


GCATCACAAA 


AATCGACGCT 


CAAGTCAGAG 


GTGGCGAAAC 




5301 


CC GAC AGGAC 


TATAAAGATA 


CCAGGCGTTT 


CCCCCTGGAA 


GCTCCCTCGT 




5351 


GCGCTCTCCT 


GTTCCGACCC 


TGCCGCTTAC 


CGGATACCTG 


TCCGCCTTTC 


50 


5401 


TCCCTTCGGG 


AAGCGTGGCG 


CTTTCTCAAT 


GCTCACGCTG 


TAGGTATCTC 




5451 


AGTTCGGTGT 


AGGTCGTTCG 


CTCCAAGCTG 


GGCTGTGTGC 


ACGAACCCCC 
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5501 CGTTCAGCCC GACCGCTGCG CCTTATCCGG TAACTATCGT CTTGAGTCCA 
5551 ACCCGGTAAG ACACGACTTA TCGCCACTGG CAGCAGCCAC TGGTAACAGG 
5601 ATTAGCAGAG CGAGGTATGT AGGCGGTGCT ACAGAGTTCT TGAAGTGGTG 
5 651 GCCTAACTAC GGCTACACTA GAAGGACAGT ATTTGGTATC TGCGCTCTGC 
5701 TGAAGCCAGT TACCTTCGGA AAAAGAGTTG GTAGCTCTTG AT CCGGCAAA 
5751 CAAACCACCG CTGGTAGCGG TGGTTTTTTT GTTTGCAAGC AGCAGATTAC 
5801 GCGCAGAAAA AAAGGATCTC AAGAAGATCC TTTGATCTTT TCTACGGGGT 
5851 CTGACGCTCA GTGGAACGAA AACTCACGTT AAGGGATTTT GGT CAT GAGA 
5901 TTATCAAAAA GGATCTTCAC CTAGATCCTT TTAAATTAAA AATGAAGTTT 
5 951 TAAATCAATC TAAAGTATAT ATGAGTAAAC TTGGTCTGAC AGTTACCAAT 
6001 GCTTAATCAG TGAGGCACCT ATCTCAGCGA TCTGTCTATT TCGTTCATCC 
6051 ATAGTTGCCT GACTCCCCGT CGTGTAGATA ACTACGATAC GGGAGGGCTT 
6101 ACCATCTGGC CCCAGTGCTG CAATGATACC GCGAGACCCA CGCTCACCGG 
6151 CTCCAGATTT ATCAGCAATA AACCAGCCAG C C GGAAGGGC CGAGCGCAGA 
6201 AGTGGTCCTG CAACTTTATC CGCCTCCATC CAGTCTATTA ATTGTTGCCG 
62 51 GGAAGCTAGA GTAAGTAGTT CGCCAGTTAA TAGTTTGCGC AACGTTGTTG 
6301 CCATTGCTAC AGGCATCGTG GTGTCACGCT CGTCGTTTGG TATGGCTTCA 
6351 TTCAGCTCCG GTTCCCAACG ATCAAGGCGA GTTACATGAT CCCCCATGTT 
6401 GTGCAAAAAA GCGGTTAGCT CCTTCGGTCC TCCGATCGTT GT C AGAAGTA 
6451 AGTTGGCCGC AGTGTTATCA CTCATGGTTA TGGCAGCACT GCATAATTCT 
6501 CTTACTGTCA TGCCATCCGT AAGATGCTTT TCTGTGACTG GTGAGTACTC 
6551 AACCAAGTCA TTCTGAGAAT AGTGTATGCG GCGACCGAGT TGCTCTTGCC 
6601 CGGCGTCAAT ACGGGATAAT ACCGCGCCAC ATAGCAGAAC TTTAAAAGTG 
6651 CTCATCATTG GAAAAC GTTC TTCGGGGCGA AAACTCTCAA GGATCTTACC 
6701 GCTGTTGAGA TCCAGTTCGA TGTAACCCAC TCGTGCACCC AACTGATCTT 
6751 CAGCATCTTT TACTTTCACC AGCGTTTCTG GGTGAGCAAA AACAGGAAGG 
6801 CAAAATGCCG CAAAAAAGGG AATAAGGGCG ACACGGAAAT GTTGAATACT 
6851 CATACTCTTC CTTTTTCAAT ATTATTGAAG CATTTATCAG GGTTATTGTC 
6901 TCATGAGCGG ATACATATTT GAATGTATTT AGAAAAATAA ACAAATAGGG 
6951 GTTCCGCGCA CATTTCCCCG AAAAGT GCC A CCTGACGTCG ACGGATCGGG 



Tabelle 1 1 : Nukleotidsequenz des rekombinanten Plasmids pIND-H-SemaL-EA (SEQ ID NO.: 38) 

45 

1 AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT 

51 TGTTCTCGTT AGCTCGAT GG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC 

101 GATGGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT 
50 

151 TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG 
201 TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC 
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2 51 AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 
301 GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA 
351 AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA 
401 GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT 
451 ACC GAGAAAG AAGAACTCAC AC AC AGC TAG CGTTTAAACT TAAGCTTGGT 
501 ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga 
551 cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc 
601 cctggcccgc cggctcggtt ggggcttccg ctgcggctgc ggctgctgct 
651 gctgctctgg gcggccgccg cctccgccca gggccaccta aggagcggac 
701 cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac 
751 tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc 
801 ctctgtgtgg gtgggaggac gtggcaaggt ctacctcttt gacttccccg 
851 agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg 
901 tcctgtctgg ataagcggga ctgcgagaac tacatcactc tcctggagag 
951 gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct 
1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc 
1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggg : a 
1101 cgaggtgtat tccaccatcc ggaagcagga atacaatggg aagatccctc 
1151 ggttccgccg catccggggc gagagtgagc tgtacaccag tgatactgtc 
1201 atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc 
1251 ttacgatgac aagatctact acttcttccg agaggacaat cctgacaaga 
1301 atcctgaggc tcctctcaat gtgtcccgtg tggcccagtt gtgcaggggg 
1351 gaccagggtg gggaaagttc actgtcagtc tccaagtgga acacttt/tct. 
1401 gaaagccatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca 
1451 ggctgcaaga cgtcttcctg ctccctgacc ccagcggcca gtggagggac 
1501 accagggtct atggtgtttt ctccaacccc tggaactact cagccgtctg 
1551 tgtgtattcc ctcggtgaca ttgacaaggt cttccgtacc tcctcactca 
1601 agggctacca ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca 
1651 gaccagcagc cgatacccac agagaccttc caggtggctg accgtcaccc 
1701 agaggtggcg cagagggtgg agcccatggg gcctctgaag acgccattgt 
1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc 
1801 agccacgggg agacctttca tgtgctttac ctaactacag acaggggcac 
1851 tatccacaag gtggtggaac cgggggagca ggagcacagc ttcgccttca 
1901 acatcatgga gatccagccc ttccgccgcg cggctgccat ccagaccatg 
1951 tcgctggatg ctgagcggag gaagctgtat gtgagctccc agtgggaggt 
2001 gagccaggtg cccctggacc tgtgtgaggt ctatggcggg ggctgccacg 
2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc 
2101 atctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc 
2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc 
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2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg 
2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca 
2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga 
2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc 
2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat 
2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct 
2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag 
2551 CttGGGCCCG AACAAAAACT CATCTCAGAA GAGGATCTGA ATAGCGCCGT 
2 601 C G AC CAT CAT CATCATCATC ATTGAGTTTA TCCAGCACAG TGGCGGCCGC 
2 651 TCGAGTCTAG AGGGCCCGTT TAAACCCGCT GATCAGCCTC GACTGTGCCT 

27 01 TCTAGTT GCC AGCCATCTGT TGTTTGCCCC TCCCCCGTGC CTTCCTTGAC 
2751 CC TGGAAGGT GCCACTCCCA CTGTCCTTTC CTAATAAAAT GAGGAAATTG 

28 01 CATC GC AT TG TCTGAGTAGG TGTCATTCTA TTCTGGGGGG TGGGGTGGGG 
2 851 CAGGACAGCA AGGGGGAGGA TTGGGAAGAC AATAGCAGGC ATGCTGGGGA 
2901 TGCGGTGGGC TCTATGGCTT CTGAGGCGGA AAGAACCAGC TGGGGCTCTA 

2 951 GGGGGTATCC CCACGCGCCC TGTAGCGGCG CAT T AAGC GC GGCGGGTGTG 
3001 GTGGTTACGC GCAGCGTGAC CGCTACACTT GCCAGCGCCC TAGCGCCCGC 
3051 TCCTTTCGCT TTCTTCCCTT CCTTTCTCGC CACGTTCGCC GGCTTTCCCC 
3101 GTCAAGCTCT AAATCGGGGC ATCCCTTTAG GGTTCCGATT TAGTGCTTTA 
3151 CGGCACCTCG ACCCCAAAAA ACTTGATTAG GGTGATGGTT CACGTAGTGG 
3201 GCCATCGCCC TGATAGACGG TTTTTCGCCC TTTGACGTTG GAGTCCACGT 

3 251 TCTTTAATAG TGGACTCTTG TTCCAAACTG GAACAACACT CAACCCTATC 
3301 TCGGTCTATT CTTTTGATTT ATAAGGGATT TTGGGGATTT CGGCCTATTG 
3351 GTTAAAAAAT GAGCTGATTT AACAAAAATT TAACGCGAAT TAATTCTGTG 
3401 GAATGTGTGT CAGTTAGGGT GTGGAAAGTC CCCAGGCTCC CCAGGCAGGC 
3451 AGAAGTAT GC AAAGCATGCA TCTCAATTAG TCAGCAACCA GGTGTGGAAA 
35 01 GTCCCCAGGC TCCCCAGCAG GCAGAAGTAT GCAAAGCATG CATCTCAATT 
3551 AGTCAGCAAC CATAGTCCCG CCCCTAACTC CGCCCATCCC GCCCCTAACT 
3601 CCGCCCAGTT CCGCCCATTC TCCGCCCCAT GGCTGACTAA TTTTTTTTAT 
3 651 TTATGCAGAG GCCGAGGCCG CCTCTGCCTC TGAGCTATTC CAGAAGTAGT 
3701 GAGGAGGCTT TTTTGGAGGC CTAGGCTTTT GCAAAAAGCT CCCGGGAGCT 
3751 TGTATATCCA TTTTCGGATC TGATCAAGAG ACAGGATGAG GATCGTTTCG 
3801 CATGATTGAA CAAGATGGAT TGCACGCAGG TTCTCCGGCC GCTTGGGTGG 
3851 AGAGGCTATT CGGCTATGAC TGGGCACAAC AGACAATCGG CTGCTCTGAT 
3901 GCCGCCGTGT TCCGGCTGTC AGCGCA GGGG CGCCCGGTTC TTTTTGTCAA 
3 951 GACCGACCTG TCCGGTGCCC TGAATGAACT GC AGGAC GAG GCAGCGCGGC 
4001 TATCGTGGCT GGCCACGACG GGCGTTCCTT GC GCAGCTGT GCTCGACGTT 
4051 GTCACTGAAG CGGGAAGGGA CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA 
4101 GGATCTCCTG TCATCTCACC TTGCTCCTGC CGAGAAAGTA TCCATCATGG 
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4151 CTGATGCAAT GCGGCGGCTG CATACGCTTG ATCCGGCTAC CTGCCCATTC 
4201 GACCACCAAG CGAAACATCG CATCGAGCGA GCACGTACTC GGAT GGAAGC 
4251 CGGTCTTGTC GATCAGGATG ATCTGGACGA AGAGCAT CAG GGGCTCGCGC 
43 01 CAGCCGAACT GTTCGCCAGG CTCAAGGCGC GCATGCCCGA CGGCGAGGAT 
4351 CTCGTCGTGA CCCATGGCGA TGCCTGCTTG CCGAATATCA TGGTGGAAAA 
4401 TGGCCGCTTT TCTGGATTCA TCGACTGTGG CCGGCTGGGT GTGGCGGACC 
4451 GCTATCAGGA CATAGCGTTG GCTACCCGTG ATATTGCTGA AGAGCTTGGC 
4501 GGCGAATGGG CTGACCGCTT CCTCGTGCTT TACGGTATCG CCGCTCCCGA 
4551 TTCGCAGCGC ATCGCCTTCT ATCGCCTTCT TGACGAGTTC TTCTGAGCGG 
4601 GACTCTGGGG TTCGAAATGA CCGACCAAGC GACGCCCAAC CTGCCATCAC 
4 651 GAGATTTCGA TTCCACCGCC GCCTTCTATG AAAGGTTGGG CTTCGGAATC 
4701 GTTTTCC GGG ACGCCGGCTG GATGATCCTC CAGCGCGGGG ATCTCATGCT 
47 51 GGAGTTCTTC GCCCACCCCA AC T T GT TT AT TGCAGCTTAT AATGGTTACA 
4 801 AATAAAGCAA TAGCATCACA AATTTCACAA AT AAAGC AT T TTTTTCACTG 
4851 CATTCTAGTT GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG 
4 901 TATACCGTCG ACCTCTAGCT AGAGCTTGGC GTAATCATGG TCATAGCTGT 

4 951 TTCCTGTGTG AAATTGTTAT CCGCTCACAA TTCCACACAA CAT AC GAGC C 

5 001 GGAAGCATAA AGT GTAAAGC CTGGGGTGCC TAATGAGTGA GCTAACTCAC 
5 051 ATTAATTGCG TTGCGCTCAC TGCCCGCTTT CCAGTC GGGA AACCT GTCGT 
5101 GCCAGCTGCA TTAATGAATC GGCCAACGCG C GGGGAGAGG CGGTTTGCGT 
5151 ATTGGGCGCT CTTCCGCTTC CTCGCTCACT GACTCGCTGC GCTCGGTCGT 
5201 TCGGCTGCGG C GAGCGG TAT CAGCTCACTC AAAGGCGGTA AT ACGGT TAT 
5251 CCACAGAATC AGGGGATAAC GCAGGAAAGA AC AT GT GAGC AAAAGGCCAG 
5 301 CAAAAGGCCA GGAACCGTAA AAAGGCCGCG TTGCTGGCGT TTTTCCATAG 
5351 GCTCCGCCCC CCTGACGAGC AT C AC AAAAA TCGACGCTCA AGTCAGAGGT 
5 401 GGCGAAACCC GACAGGACTA TAAAGATACC AGGCGTTTCC CCCTGGAAGC 
5451 TCCCTCGTGC GCTCTCCTGT TCCGACCCTG CCGCTTACCG GATACCTGTC 
5501 CGCCTTTCTC CCTTCGGGAA GCGTGGCGCT TTCTCAATGC TCACGCTGTA 
5551 GGTATCTCAG TTCGGTGTAG GTCGTTCGCT CCAAGC T GGG CTGTGTGCAC 
5601 GAACCCCCCG TTCAGCCCGA CCGCTGCGCC TTATCCGGTA ACTATCGTCT 
5651 TGAGTCCAAC CCGGTAAGAC ACGACTTATC GCC ACT GGC A GCAGCCACTG 
5701 GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC AGAGXTCTTG 
5751 AAGTGGTGGC CTAACTACGG CTACACTAGA AGGACAGTAT TTGGTATCTG 
5801 CGCTCTGCTG AAGCCAGTTA CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT 
5851 CCGGCAAACA AACCACCGCT GGTAGCGGTG GTTTTTTTGT TTGCAAGCAG 
5901 CAGATTACGC GCAGAAAAAA AGGATCTCAA GAAGATCCTT TGATCTTTTC 
5951 TACGGGGTCT GACGCTCAGT GGAACGAAAA CTCACGTTAA GGGATTTTGG 
6001 T CAT GAG ATT AT C AAAAAGG ATCTTCACCT AGATCCTTTT AAATTAAAAA 
6051 TGAAGTTTTA AATCAATCTA AAGT AT AT AT GAGTAAACTT GGTCTGACAG 
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6101 TTACCAATGC TTAATCAGTG AGGCACCTAT CTCAGCGATC TGTCTATTTC 
6151 GTTCATCCAT AGTTGCCTGA CTCCCCGTCG TGTAGATAAC TAC GAT ACGG 
6201 GAGGGCTTAC CATCTGGCCC CAGTGCTGCA AT GAT ACC GC GAGACCCACG 
6251 CTCACCGGCT CCAGATTTAT CAGCAATAAA CCAGCCAGCC GGAAGGGCCG 
6301 AGCGCAGAAG TGGTCCTGCA ACTTTATCCG CCTCCATCCA GTCTATTAAT 
6351 TGTTGCCGGG AAGCTAGAGT AAGTAGTTCG CCAGTTAATA GTTTGCGCAA 
6401 CGTTGTTGCC ATTGCTACAG GCATCGTGGT GTCACGCTCG TCGTTTGGTA 
6451 TGGCTTCATT CAGCTCCGGT TCCCAACGAT CAAGGCGAGT TACATGATCC 
6501 CCCATGTTGT GCAAAAAAGC GGTTAGCTCC TTCGGTCCTC CGATCGTTGT 
6551 CAGAAGTAAG TTGGCCGCAG TGTTATCACT CATGGTTAT G GCAGCACTGC 
6601 ATAATTCTCT TACTGTCAT G CCATCCGTAA GATGCTTTTC TGTGACTGGT 
6651 GAGTACTCAA CCAAGTCATT CTGAGAATAG TGTATGCGGC GACCGAGT TG 
6701 CTCTTGCCCG GCGTCAATAC GGGATAATAC CGCGCCACAT AGCAGAACTT 
6751 TAAAAGTGCT CATC AT T GGA AAACGTTCTT CGGGGCGAAA ACTCTCAAGG 
6801 ATCTTACCGC TGTTGAGATC CAGTTCGATG TAACCCACTC GTGCACCCAA 
6851 CTGATCTTCA GCATCTTTTA CTTTCACCAG CGTTTCTGGG TGAGCAAAAA 

6 901 CAGGAAGGCA AAATGCCGCA AAAAAGGGAA TAAGGGCGAC ACGGAAATGT 
6951 TGAATACTCA TACTCTTCCT TTTTCAATAT TAT T GAAGC A TTTATCAGGG 
7001 TTATTGTCTC ATGAGCGGAT AC AT AT TT GA AT GT AT T TAG AAAAATAAAC 

7 051 AAATAGGGGT TCCGCGCACA TTTCCCCGAA AAGTGCCACC TGACGTCGAC 
7101 GGATCGGG 



Tabetle 1 2: Sequenz des rekombinanten Plasmids pQE30-H-SemaL-BH (SEQ ID NO.: 39) 



1 C TC GAGAAAT CATAAAAAAT TTATTTGCTT T GTGAGCGGA TAACAATTAT 
51 AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG 
101 AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA TCACGGAtcc 
151 ctggttctgt ttgaagggga cgaggtgtat tccaccatcc ggaagcagga 
201 atacaatggg aagatccctc ggttccgccg catccggggc gagagtgagc 
251 tgtacaccag tgatactgtc atgcagaacc cacagttcat caaagccacc 
301 atcgtgcacc aagaccaggc ttacgatgac aagatctact acttcttccg 
351 agaggacaat cctgacaaga atcctgaggc tcctctcaat gtgtcccgtg 
401 tggcccagtt gtgcaggggg gaccagggtg gggaaagttc actgtcagtic 
451 tccaagtgga acacttttct gaaagccatg ctggtatgca gtgatgctgc 
501 caccaacaag aacttcaaca ggctgcaaga cgtcttcctg ctccctgacc 
551 ccagcggcca gtggagggac accagggtct atggtgtttt ctccaacccc 
601 tggaactact cagccgtctg tgtgtattcc ctcggtgaca ttgacaaggt 
651 cttccgtacc tcctcactca agggctacca ctcaagcctt cccaacccgc 
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701 


ggcctggcaa 


gtgcctccca 


g^ccagcagc 


cgatacccac 


a gaAAGC TT A 




751 


ATTAGCTGAG 


CTTGGACTCC 


TGTTGATAGA 


TCCAGTAATG 


ACC T CAGAAC 


5 


801 


TCCATCTGGA 


TTTGTTCAGA 


ACGCTCGGTT 


GCC GCCGGGC 


GTTTTTTATT 




851 


GGTGAGAATC 


CAAGCTAGCT 


TGGCGAGATT 


TTCAGGAGCT 


AAGGAAGCTA 




901 


AAATGGAGAA 


AAAAATCACT 


GGATATACCA 


CCGTTGATAT 


ATCCCAATGG 




951 


CATCGTAAAG 


AACATTTTGA 


GGCATTTCAG 


TCAGTT GCTC 


AATGTACCTA 


10 


1001 


TAACCAGACC 


GTTCAGCTGG 


ATATTACGGC 


CTTTTTAAAG 


ACCGTAAAGA 




1051 


AAAATAAGCA 


CAAGTTTTAT 


CCGGCCTTTA 


TTCACATTCT 


TGCCCGCCTG 




1101 


ATGAATGCTC 


ATCCGGAATT 


TCGTATGGCA 


ATGAAAGACG 


GTGAGCTGGT 




1151 


GATATGGGAT 


AGT GTTCACC 


CTTGTTACAC 


CGTTTTCCAT 


GAGCAAACTG 


15 


1201 


AAACGTTTTC 


ATCGCTCTGG 


AGTGAATACC 


ACGACGATTT 


CCGGCAGTTT 




1251 


CT AC AC AT AT 


ATTCGCAAGA 


TGTGGCGTGT 


TACGGTGAAA 


ACCTGGCCTA 




1301 


TTTCCCTAAA 


GGGTTTATTG 


AGAATATGTT 


TTTCGTCTCA 


GCCAATCCCT 




1351 


GGGTGAGTTT 


CACCAGTTTT 


GATTTAAACG 


TGGCCAATAT 


GGACAACT TC 


20 


1401 


TTCGCCCCCG 


TTTTCACCAT 


GGGCAAATAT 


TATACGCAAG 


GC GAC AAGGT 




1451 


GCTGATGCCG 


CTGGCGATTC 


AGGTTCATCA 


T GCCGTCT GT 


GAT GGCTTCC 




1501 


ATGTCGGCAG 


AATGCTTAAT 


GAATTACAAC 


AGTACTGCGA 


TGAGT GGCAG 


25 


1551 


GGCGGGG CGT 


AATTTTTTTA 


AGGCAG T TAT 


TGGTGCCCTT 


AAACGCCTGG 


1601 


GGTAATGACT 


CTCTAGCTTG 


AGGCATCAAA 


TAAAACGAAA 


GGCTCAGTCG 




1651 


AAAGACTGGG 


CCTTTCGTTT 


TATCTGTTGT 


TTGTCGGTGA 


ACGCTCTCCT 




1701 


GAGTAGGACA 


AATCCGCCGC 


TCTAGAGCTG 


CCTCGCGCGT 


TTCGGTGATG 


30 


1751 


ACGGTGAAAA 


CCTCTGACAC 


ATGCAGCTCC 


C GGAGAC GGT 


CACAGCTTGT 


1801 


CTGTAAGCGG 


ATGCCGGGAG 


CAGACAAGCC 


CGTCAGGGCG 


CGTCAGCGGG 




1851 


TGTTGGCGGG 


TGTCGGGGCG 


CAGCCAT GAC 


CCAGTCACGT 


AGCGATAGCG 




1901 


GAGTGTATAC 


TGGCTTAACT 


ATGCGGCATC 


AGAGCAGATT 


GT ACT GAGAG 


35 


1951 


TGCACCATAT 


GCGGTGTGAA 


AT ACCGC ACA 


GATGCGTAAG 


GAGAAAATAC 




2001 


CGCATCAGGC 


GCTCTTCCGC 


TTCCTCGCTC 


ACTGACTCGC 


TGCGCTCGGT 




2051 


CTGTCGGCTG 


CGGCGAGCGG 


TATCAGCTCA 


C TC AAAGGCG 


GTAATACGGT 




2101 


TATCCACAGA 


ATCAGGGGAT 


AACGCAGGAA 


AGAAC AT GT G 


AGCAAAAGGC 


40 


2151 


CAGCAAAAGG 


CCAGGAACCG 


TAAAAAGGCC 


GCGTTGCTGG 


CGTTTTTCCA 




2201 


TAGGCTCCGC 


CCCCCTGACG 


AGCATCACAA 


AAATCGACGC 


TCAAGTCAGA 




2251 


GGTGGCGAAA 


CCCGACAGGA 


CTATAAAGAT 


ACCAGGCGTT 


TCCCCCTGGA 




2301 


AGCTCCCTCG 


TGCGCTCTCC 


TGTTCCGACC 


CTGCCGCTTA 


CCGGATACCT 


45 


2351 


GTCCGCCTTT 


CTCCCTTCGG 


GAAGCGT GGC 


GCTTTCTCAA 


TGCTCACGCT 




2401 


GTAGGTATCT 


CAGTTCGGTG 


TAGGTCGTTC 


GCTCCAAGCT 


GGGCTGTGTG 




2451 


CACGAACCCC 


CCGTTCAGCC 


CGACCGCTGC 


GCCTTAT CCG 


GTAACTATCG 


50 


2501 


TCTTGAGTCC 


AACCCGGTAA 


GAC AC GAC T T 


ATCGCCACTG 


GCAGCAGCCA 


2551 


CTGGTAACAG 


GAT T AGCAGA 


GC GAG GT AT G 


TAGGCGGTGC 


TACAGAGTTC 




2601 


TTGAAGTGGT 


GGCCTAACTA 


CGGCTACACT 


AGAAGGACAG 


TATTTGGTAT 
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2651 CTGCGCTCTG CTGAAGCCAG TTACCXTCGG AAAAAGAGTT GGTAGCTCTT 
2701 GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG 
5 2751 CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT 

2801 TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT 
2851 TGGTCATGAG ATTATCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA 

2 901 AAATGAAGTT TTAAATCAAT CTAAAGTATA TAT GAGTAAA CTTGGTCTGA 

10 2951 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 

3 001 ttcgttcatc catagctgcc tgactccccg tcgtgtagat aactacgata 
3051 cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 
3101 acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 

3151 CCGAGCGCAG AAGTGGTCCT GCAACTTTAT CCGCCTCCAT CCAGTCTATT 

3201 AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG 

3251 CAACGTTGTT GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG 

so 3301 GTATGGCTTC ATTCAGCTCC GGTTCCCAAC GATCAAGGCG AGTTACATGA 

3351 TCCCCCATGT TGTGCAAAAA AGCGGTTAGC TCCTTCGGTC C TCCGATCGT 

3401 TGTCAGAAGT AAGTTGGCCG CAGTGTTATC ACTCATGGTT ATGGCAGCAC 

3451 TGCATAATTC TCTTACTGTC ATGCCATCCG TAAGATGCTT TTCTGTGACT 

ss 3501 GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC ggcgaccgag 

3551 TTGCTCTTGC CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA 

3601 CTTTAAAAGT GCTCATCATT GGAAAACGTT CTTCGGGGCG AAAACTCTCA 

3651 AGGATCTTAC CGCTGTTGAG ATCCAGTTCG ATGTAACCCA CTCGTGCACC 

30 3 7 01 CAACTG ATCT TCAGCATCTT TTACTTTCAC CAGCGTTTCT GGGTGAGCAA 

3751 AAACAGGAAG GCAAAATGCC GCAAAAAAGG GAATAAGGGC GACACGGAAA 

3801 TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA GCATTTATCA 

3851 GGGTTATTGT CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA 

35 3901 AACAAATAGG GGTTCCGCGC ACATTTCCCC GAAAAGTGCC ACCTGACGTC 

3951 TAAGAAACCA TTATTATCAT GACATTAACC TATAAAAATA GGCGTATCAC 

4001 GAGGCCCTTT CGTCTTCAC 
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> 13: Sequenz des rekombinanlen Plasmids pQE31-H-Semal-SH (SEQ ID NO.: 40) 

1 CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT 
51 AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG 
101 AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA TCACACGGAT 
151 CCGCATGCga gctcccagtg ggaggtgagc caggtgcccc tggacctgtg 
201 tgaggtctat ggcgggggct gccacggttg cctcatgtcc cgagacccct 
251 actgcggctg ggaccagggc cgctgcatct ccatctacag ctccgaacgg 
301 tcagtgctgc aatccattaa tccagccgag ccacacaagg agtgtcccaa 
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351 

401 

451 

501 

551 

601 

651 

701 

751 

801 

851 

901 

951 

1001 

1051 

1101 

1151 

1201 

1251 

1301 

1351 

1401 

1451 

1501 

1551 

1601 

1651 

1701 

1751 

1801 

1851 

1901 

1951 

2001 

2051 

2101 

2151 

2201 

2251 



ccccaaacca 
ctcgctacta 
tggcgccaca 
ccccaactgc 
actacttctg 
tggcagctgc 
tgcctgtgcc 
ctcttggctt 
TGTTGATAGA 
ACGCTCGGTT 
TGGCGAGATT 
GGATATACCA 
GGCATTTCAG 
ATATTACGGC 
CCGGCCTTTA 
TCGTATGGCA 
CTTGTTACAC 
AGTGAATACC 
TGTGGCGTGT 
AGAAT AT GTT 
GATTTAAACG 
GGGCAAATAT 
AGGTTCATCA 
GAATTACAAC 
AGGCAGTTAT 
AGGCATCAAA 
TATCTGTTGT 
TCTAGAGCTG 
ATGCAGCTCC 
CAGACAAGCC 
CAGCCATGAC 
ATGCGGCATC 
AT AC C GC AC A 
TTCCTCGCTC 
TATCAGCTCA 
AACGCAGGAA 
TAAAAAGGCC 
AGCATCACAA 
C T AT AAAGAT 



gacaaggccc 
cctgagctgc 
aggagaacgt 
atcctgttca 
cgaggcccag 
tgcccgagga 
ctggctgcct 
gctggtccac 
TCCAGTAATG 
GCCGCC GGGC 
TT CAGGAGC T 
CC GTT GAT AT 
TCAGTTGCTC 
CTTTTTAAAG 
TTCACATTCT 
AT GAAAGAC G 
CGTTTTCCAT 
ACGACGATTT 
TACGGTGAAA 
TTTCGTCTCA 
TGGCCAATAT 
TATACGCAAG 
TGCCGTCTGT 
AGTACTGCGA 
TGGTGCCCTT 
TAAAACGAAA 
TTGTCGGTGA 
CCTCGCGCGT 
CGGAGACGGT 
CGTCAGGGCG 
CCAGTCACGT 
AGAGCAGATT 
GATGCGTAAG 
ACTGACTCGC 
CTCAAAGGCG 
AGAACATGTG 
GCGTTGCTGG 
AAATCGACGC 
ACCAGGCGTT 



cactgcagaa 
cccatggaat 
ggagcagagc 
tcgagaacct 
gagggctcct 
cggcatcatg 
ccctctggct 
gtgaagcttA 
ACCTCAGAAC 
GTTTTTTATT 
AAGGAAGC T A 
ATCCCAATGG 
AATGTACCTA 
ACCGTAAAGA 
TGCCCGCCTG 
GTGAGCTGGT 
GAGCAAACTG 
CCGGCAGTTT 
ACCTGGCCTA 
GCCAATCCCT 
GGACAACTTC 
GCGACAAGGT 
GATGGCTTCC 
TGAGTGGCAG 
AAACGCCTGG 
GGCTCAGTCG 
ACGCTCTCCT 
TTCGGTGATG 
CACAGCTTGT 
CGTCAGCGGG 
AGCGATAGCG 
GTACTGAGAG 
GAGAAAATAC 
TGCGCTCGGT 
GTAATACGGT 
AGCAAAAGGC 
CGTTTTTCCA 
TCAAGTCAGA 
TCCCCCTGGA 



ggtttccctg 

cccgccacgc 

tgcgaacctg 

cacggcgcag 

acttccgcga 

gccgagcacc 

gggggtgctg 

ATTAGCTGAG 

TCCATCTGGA 

GGTGAGAATC 

AAATGGAGAA 

CATCGTAAAG 

TAACCAGACC 

AAAATAAGCA 

ATGAATGCTC 

GATATGGGAT 

AAACGTTTTC 

CTACACATAT 

TTTCCCTAAA 

GGGTGAGTTT 

TTCGCCCCCG 

GCTGATGCCG 

ATGTCGGCAG 

GGCGGGGCGT 

GGTAATGACT 

AAAGACTGGG 

GAGTAGGACA 

ACGGTGAAAA 

CTGTAAGCGG 

TGTTGGCGGG 

GAGTGTATAC 

TGCACCATAT 

CGCATCAGGC 

CTGTCGGCTG 

TATCCACAGA 

CAGCAAAAGG 

TAGGCTCCGC 

GGTGGCGAAA 

AGCTCCCTCG 



gccccaaact 
cacctactca 
gtcaccagag 
cagtacggcc 
ggctcagcac 
tgctgggtca 
cccacactca 
CTTGGACTCC 
TTTGTTCAGA 
CAAGCTAGCT 
AAAAATCACT 
AACATTTTGA 
GTTCAGCTGG 
CAAGTTTTAT 
ATCCGGAATT 
AGTGTTCACC 
ATCGCTCTGG 
ATT C GCAAGA 
GGGTTTATTG 
CACCAGTTTT 
TTTTCACCAT 
CTGGCGATTC 
AATGCTTAAT 
AATTTTTTTA 
CTCTAGCTTG 
CCTTTCGTTT 
AATCCGCCGC 
CCTCTGACAC 
ATGCCGGGAG 
TGTCGGGGCG 
TGGCTTAACT 
GCGGTGTGAA 
GCTCTTCCGC 
CGGCGAGCGG 
AT C AGGGGAT 
CCAGGAACCG 
CCCCCTGACG 
CCCGACAGGA 
TGCGCTCTCC 
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2301 TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG 
2351 GAAGCGTGGC GCTTTCTCAA TGCTCACGCT GTAGGTATCT CAGTTCGGTG 
2401 TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC CCGTTCAGCC 
24 51 CGACCGCTGC GCCTTATCCG GTAACTATCG TCTTGAGTCC AACCCGGTAA 
2501 GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GAT T AGCAGA 
2551 GCGAGGTATG T AGGCGGT GC TACAGAGTTC TTGAAGTGGT GGCCTAACTA 
2601 CGGCTACACT AGAAGGACAG TATTTGGTAT CTGCGCTCTG CT GAAGCCAG 
2 651 TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC 
2701 GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG C AGCAGAT T A CGCGCAGAAA 
2751 AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC 
2801 AGT GGAAC GA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA 
2 8 51 AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT 
2 901 CTAAAGTATA TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA 

2 951 GT GAGGC ACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGCT GCC 
3001 TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG 
3051 CCCCAGTGCT GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT 
3101 TAT CAGC AAT AAACCAGCCA GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT 
3151 GCAACTTTAT CCGCCTCCAT CCAGTCTATT AATTGTTGCC GGGAAGCTAG 
3201 AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG CAACGTTGTT GCC ATT GC T A 
3251 CAGGCATCGT GGTGTCACGC TCGTCGTTTG GTATGGCTTC ATTCAGCTCC 

3 301 GGTTCCCAAC GAT C AAGGC G AGTTACAT GA TCCCCCATGT TGTGCAAAAA 
3351 AGCGGTTAGC TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGT TGGCCG 
3401 CAGTGTTATC ACTCATGGTT ATGGCAGCAC TGCATAATTC TCTTACTGTC 
3451 ATGCCATCCG TAAGATGCTT TTCTGTGACT GGTGAGTACT CAACCAAGTC 
3501 ATTCTGAGAA TAGTGTATGC GGCGACCGAG TTGCTCTTGC CCGGCGTCAA 
3551 TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCT CATC ATT 
3 601 GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG 
3651 ATCCAGTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT 
3701 TTACTTTCAC CAGCGTTTCT GGGTGAGCAA AAACAGGAAG GCAAAATGCC 
3751 GCAAAAAAGG GAATAAGGGC GACACGGAAA TGTTGAATAC TCATACTCTT 
38 01 CCTTTTTCAA TATTATTGAA GCATTTATCA GGGTTATTGT CTCATGAGCG 
3851 GATACATATT TGAAT GT ATT TAGAAAAATA AACAAATAGG GGTTCCGCGC 
3 901 ACATTTCCCC GAAAAGT GCC ACCTGACGTC TAAGAAACCA T TAT TAT CAT 
3 951 GAC AT TAACC TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC 



Tablelle 14: (Partielle) Nukleotidsequenz des humanen Semaphorin L Gens. 
(8888 Nukleotide) (SEQ ID NO.: 41): 
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GAGCCGCACACGGTGCTTTTCCACGAGCCAGGCAGCTCCTCTGTGTGGGTGGGAGGACGT 
GGCAAGGTCTACCTCTTTGACTTCCCCGAGGGCAAGAACGCATCTGTGCGCACGGTGAGC 
5 CTCTCTCTTCCCCCAACACCCCCCCTACCCTCTTATCTCCCCTCTGGCCCTGCCAAGGGT 

CCTCAGGGAATCCGAGGGAGCTGGCTTCTCTTCCTAAACTGCCCCCACCTCCGTATCCTA 
T AAAT GGC TCCTGGGGGAGGCTCCCT AAAGGT AGTCCAGATT GGAGTGGGGAGC TGGGGC 
GGTGTGGAGAAAAACAGGAGCTAATGGGCCTGGCCAGCTGGGCAGCGCTGCTGCGGAAAG 
10 CCCAGGCTGGAAGCTGGGCCCCAGAGCCCATGCCTGGTCTTCTGAACCCTCTGGGCCTCA 

GCTCTGGATATGAGACCCTGTTTGACCTCAGGTAGATCACTCACCCTCTCAGAGCCCCAG 
TTGCTCATCTGTCAGATGAGAATAATGGTTGCTTCCTTTGGGGCTTATCCTGAGGCTGTG 
TGGAAAGCATTTCAGGGGTACCTCACCCCTGGCAGATTGAACTAATGCTTCTCCCCTTCC 
15 CCAGGTGAATATCGGCTCCACAAAGGGGTCCTGTCTGGATAAGCGGGTGAGCGGGGGAGG 

GAT CT GGAGGGGT C T GAGCC AC TTGGTAAAGGGAGAGGAGACCCT GAGGGTCTAAGGAAG 
GAAGCATGGCCCTGCCCCACGAGTCCCAGACTGATGGGGAGACGTGGTCCTCTGTGCTTA 
GGGGATGGCGTCAGCTGCACACACTCTGGGCTGTCCCGGGAGGCTGTCACCTATGCTAAG 

20 

CCCTTCTGACACCTTCTTCCCTGATCCTGGGGGTCCTAGTGCTAGGCTTGCCAGGGCCTT 

CCAGCAACCAATTTCTCTCCTCCCTTCTCTCTTCCCCGGGCAGGACTGCGAGAACTACAT 

CACTCTCCTGGAGAGGCGGAGTGAGGGGCTGCTGGCCTGTGGCACCAACGCCCGGCACCC 

CAGCTGCTGGAACCTGGTGAGAAGGCTGCTCCCCATGTGCCTGATCAGCTCACCTTCTAC 

25 

TGCGTGGGCTTCTGCCCCTCATGGTGGGAAGGAGATGGCGAGACTCCAATGCTGGCCTTG 

CCCTGGGAGGATGGGGCTCCTGGCCGAGAAACTGGCCGTCATGGGAGGCAGTGGCTGTGG 

GATTATGTGGCCATCCAACCCTCTGGATCTCCCACAGGTGAATGGCACTGTGGTGCCACT 

30 TGGCGAGATGAGAGGCTACGCCCCCTTCAGCCCGGACGAGAACTCCCTGGTTCTGTTTGA 

AGGTTGGGGCATGCTTCGGAACTGGGCTGGGAGCAGGATGGTCAGCTCTTTGTCCAGTGT 

CCGGAGGAGGGACTTCCAGGAGCTGCCTGCCCTTACTCATTTCTCCCTCCCACTGACCCC 

AGGGGAC GAGGTGT AT TCC ACC ATC CGGAAGCAGGAAT ACAAT GGGAAGATCCCTCGGT T 

35 CCGCCGCATCCGGGGCGAGAGTGAGCTGTACACCAGTGATACTGTCATGCAGAGTGAGTC 

AGGCT CC GGC T GGGCT GAGGG T GGGC AAGGGGGT GT GAGC ACT T AAGGT GGCAGAT GGGA 

TCCTGATGTTTCTGGGAGGGCTCCCTGAGGGCCGCTGGGGCCATGCAGGAAAGCAGGACC 

T T GGT AT AGGC CT GAGAAGTT AGGGTT GGC T GGGAGCAGAGGAACAGAC AAGGTAT AGO A 

40 GTGGGATGGGCCCAGCCCTCTTCAGGAACACAAACAGAGGGAGCCCCAGACCCAGTGCAG 

GGTCCCCAGGAGCCAAAGTTTATCCTCTGCTGAGTTCACGTGGAGGCAGCCCCCCAACTC 

C C T C C T C ATC AGGGC T C T GCC AAT T GAGC AGAAGT G ACAT AGGGGCCCCCAGGGAC C T T C 

CCCCACTCCCCAGGCATGAAGTCATTGCTCCTGGGCCGATGACATCTTTGTAGGAAGAGG 

45 

GCAAAACAGGTGTGGGGTGGAGGTGCAGGGTCTAGGGCCCCTCGGGGAGTTGGACCTGAT 
GTTATGAGTCCTATTCCAGATCTGATTTGCCATGGTTTGTGCAGACCCGAAGGAGGGAGG 
AGAGTGTGCAGGGTTGGAATGGTCTCCCGGGCAAGCTTCCCAGCCTTACGCCCATTCGCT 
50 TCTGTGCCCTGGCAGACCCACAGTTCATCAAAGCCACCATCGTGCACCAAGACCAGGCTT 

AC GATGAC AAGATCTACT AC T TCT TCC GAGAGGAC AATCCT GACAAGAATCCTGAGGCTC 
CTCTCAATGTGTCCCGTGTGGCCCAGTTGTGCAGGGTGAACACGGGCGTGAGGGCTGCTG 
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gctacgtgtctgtgcatgaataggcctgagtgagggtgagttctgtgtgtccgtgtgcat 

GTAGAAGTTGTGTGGATGTATGAGTGGGTCTGTGTCAGGGACTGTGGGAGCAGCTGTGTG 
TGCATGGAGCATCATGTGTCTGTGTGTGGGTAAAGGTGGCTGAGCTCCTGTGCACGTATG 
ATGGCGTGTGAGCGTGTGTATGATGGGGTGTGTGTGTGTGTGTGTGTGTGTGTTTTGCCT 
GTGTGAATGTGCTGTGCCACGTATGTGGGTGCGTGAGTCAGTAAATGTGTGTCTGAGTCC 
GTCTGCTCTGTGGGGACCTGGCACTCTCACCTGCCCTGACCCTGGGCACTGCTGGCCCTG 
GGCTCTGGATCAGCCAGGCCTGCTTGCAGGAGTCTCATCTGGAGACCTGCCCTGAGTCCT 
GGGGCACCCCCGGCAGGTCCTGGCCCCTCGCAGCCTGCCTTCCTCCTCTGGGCCCAGGTG 
TTGATATTGCTGGCAGTGGTTTCCTGGGGTGTGTGGGGAAGCCCGGGCAGGTGCTGAGGG 
GCCTCTTCTCCCCTCTACCCTTCCAGGGGGACCAGGGTGGGGAAAGTTCACTGTCAGTCT 
CCAAGTGGAACACTTTTCTGAAAGCCATGCTGGTATGCAGTGATGCTGCCACCAACAAGA 
ACTTCAACAGGCTGCAAGACGTCTTCCTGCTCCCTGACCCCAGCGGCCAGTGGAGGGACA 
CCAGGGTCTAT GGTGTTTTCTCCAACCCCTGGTGAGTGGCCCTTGTCCTGGGGCCGGGGC 
TGGCATTGGTTCAGTGTCCAGTAGGGACAGGAGGCCTTGGGCCCTGCTGAGGGCCTCCCT 
GGTGTGGCAGGAGCAGGGGCTGCAGGCTCAAGAGGCTGGGCTGTTGCTGGGTGTGGGGTG 
GGGGGACAGCCAGTGCGATGTATGTACTGTTGTGTGAGTGAGTCTGCACTCATGGGTGTG 
TGTGCATGCCCTATATGCACACTCATGACTGCACTTGTGCCTGTGTGTCCCACCACCTGC 
T T GT GCCGAGAGT GGAC ACT GG GCCCAGGAGGAAGCT GC T GAAGCATC T CT C GGGGAGCT 
GGGTGCTATTACACCTGCTCAGGCACTGCCTGAGCCCGATAATTCACACTTCTTAATCAC 
TCTCATTGATTGAACACACGGCAGGCGGAAGTGTTGGGTGTGTGTGGGGAGAGTTAGGGA 
TAGAGTGGAGGAAGCCAAGACCCTGCTCTGTGGCTCCTGGGTGAGTGGGTCCCCCAGGCT 
GGGAAGGGGTTGGGGGTCTGGCCTCCTGGGGCATCAGCACCCCACAGCCTGTGCCCAGGG 
AGGGCTAGAGAACTGCTCAGCCTATGATGGGGTTCCTCCTGCCTTGGGGTTGGGTAGAGC 
AGATGGCCTCTAGACTCAGTGATTCTGTAACAGGATACAAGTTTGTGGTTTTAAATTGCA 
GCACAAAGAAATTAGGCTGAACTCCTCTCCTTCCTCCTCTCCATCCCTCCCCATTTTCAG 
TGGTGGTTGGCAACTCAGTGCCAGGCACAAGGCTGGCCTGGGTGAGTGGAGGTGGATGGG 
TGGGTTCTGGGCCCCCCATTGAGCTGGTCTCCATGTCACTGCAGGAACTACTCAGCCGTC 
TGTGTGTATTCCCTCGGTGACATTGACAAGGTCTTCCGTACCTCCTCACTCAAGGGCTAC 
CACTCAAGCCTTCCCAACCCGCGGCCTGGCAAGGTGAGCGTGACACCAGCCGTGGCCCAG 
GCCCAGCCCTCCTTCTGCCTCACCTCCCACCACCCCACTGACCTGGGCCTGCTCTCCTTG 
CCCAGTGCCTCCCAGACCAGCAGCCGATACCCACAGAGACCTTCCAGGTGGCTGACCGTC 
ACCC AG AG GT GGC GC AG AGGGT GGAGC CC AT GGGGCC T C T GAAGAC GC CAT T GT T CC ACT 
CTAAATACCACTACCAGAAAGTGGCCGTCCACCGCATGCAAGCCAGCCACGGGGAGACCT 
TTCATGTGCTTTACCTAACTACAGGTGAGAGGCTACCCCGGGACCCTCAGTTTGCTTTGT 
AAAAACGGGCATGAAAGGTGTAAGGAATAATGTAGTTAACATCTGGTTGGATCTTTACAT 
GTGGAAGGAATAATTGAGTGACTGGAGTTGTCAGGGGTTAATGTGTGTGGGTGTGGAAGA 
GCCAGGCAGGGAGAGCTTCCTGGAGGAGGTAGGGGCAAGAGGGAAAGGGGGATGGGAGAA 
AAGC AAGC AC T GGGAT T T GGAG GC GGAAAT CT GG AGAGT CT GAGC AAAGCCAGGT GCACC 
T T T G GT C C AG AT GT C T G AC T C AG GGAAG AAGAT GGT AGGAAGAGAC GT GGC AAAT GAGG A 
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GGAGGGGCC T GAACCAC AGGGAT AC TGGCCT CTGC CAGGCAGAATGAGGGAGTC AGGCCC 

T GCGCCT GTCTT T GGGAT T GTGC AGGTGAGAAGAAACATT T GAGGAGTT GATGGGGC ACA 
AAT T AGGTATGGGGAAGGAGTTCCAGGGGGC AGAACCT TT GCCATCTCAC AGAGGACAGG 
GGCAGCTTCTCTTCTTCCCTGGAGTAGGCCCTGCTGGGGGAAGCTGGGTGGAATGCCGTG 

G GAGAT GCT CCT GC T T TC T GGAAAGCCAC AGGAC AC GG AGGAGCC AGT CCT GAGTT GGGT 

TTGTCGCAGCTTCCCATGCCAGCTGCCTTCCTTGAGACTGGAAAGGGCCTCTAGCACCCC 
TGGGGCCATTCAATTCAGGCCCAGGCGCCCAACCTCAGTTGTTCACATTCCCCATGTGAT 
CT C C TGT T GC T GC T TC ACCT T GGGACT GT CT C GGC T T T GGT GACCT T GT AGGAAAC T GGA 
ACCCCAGCACCATTGTTTGGCTCCTGGAAGCCTTGGGGAGAGGAATTTCCCACAGGGCAG 
GGCCTGGGTCCTGATTCCCTGCCTCTTTACTCCCTATTCATCCCGGCTACACCCTTGGGC 
CCCCATCCTTGCTTGGCTCCAGTACTGGCTGGCACAGCTGTTGTGGTCATCCAGGGATGG 

C AGGGC AC T G GGGAAC AGAAGAGAG AGGT C AC AC AGT GCGGAAC T GGGAGC AGGAGC TAG 
GAC AAGGAAGGCT GGAC T T GGGCCAT GGAT T CCCT TCC TGC AGACT T GGGAAGT GAGCAC 

ACT T GAGTGATT AGAGAAGGTGT CT TCGT TC T AAGGGCAGT GGAGGAGGCACCATTT TGG 
AGC C T GC AT C AT TC GT AT T T GG GC T AGAT TGAAAAAT AGAGCT T T CT AAGT CCT CTGCAG 
AGAATGGGAGGCTCTCACAACTGGGAGAAGTATTGGCTCTTTTCCTGAGAATTTTGCCAA 
GGGTATGCTGTTACTGGGGCTGGTTTGGAAGGAGTATAGGGCATTATGTCTGTGAAGGCA 
GTGGCT GGGGT GGGGCCTT ATC AGGCCCAAGGAGCATCT GGCCACATCTCAGAGTCCACA 
GAT GAGGATCACGGATGTGT AGAGGAAACATCCTAGGC AGGC AATCATCTGACT GCTT TT 

T TGGGGC AGGTGAT GCCCT GGGAAAT T GGGAGGGAGGGAGAGAGGGAGGTAGGC TAT T CT 

AGAAACTGGGAGAGCAGGTGAGGTAGGATTGGGAGGACCAGGGGTCAGGGTCCCCATTGG 

TCCCTAATTGAGAACGGAGAGAGCATTGGTCTAGGAGGCAGGCAGCTCGGTTATAAGACC 

TTGGGAACTCTTGATTTAGAATCCAAGATCCTTTTTAGATCTAGGATTTTATAAAATTAA 

GATATCCCCTAAGATCAAATGCAACGTGGAGTCCTGAATTGGATCCTAGAACAGAAGAAG 

GAC AT TT GT GGAAAAACT AGTGAAATCCAAATAAAGTCT GT AGT T TT GTT AAT AGT AATG 

CACCAATGTCAGTTGCCTAGTTGTGACAAATATACCGTGGTTATGTAAGATGGTAACATT 
AGGGGGAACTGGAGAAGGGTAGATTGGAGCTCTCTGTACTATCTTTGCAACTTTTCTGGG 
AAT CT AAAAT T AC T C C AAAAT AAAAAAAAAAT GT AT T T AAAGT AAAT AT AT T CCCT AAGA 

GTCC AGGAGGCAGGGGAGT T GT AGAAGC AGCT GAGT GGTT GGGTTCT GACAGAT TTGGTT 

CCAACTCGGTCTCTGCTGCTCACCAGCTGTGTGACCTTGAGCAAGTGGCTTAGCCTTTCT 

GAGCCTGATTTCCTTATCTGTGGAGTGGGGAAGATGACAGCCACCTCGCAGGGCTGTGGA 

GGGTTAAACGAGGTGATGCATGGACAGCAGCCGCACTGACCTTGCTGGTGTGGGGCTCCT 

GCTTCTGTTCTTCCCGTGCAGCCTTGGGAATGTTGGAGGCCGTATCCAGGGACCCCTGGG 

CCTCCTGGGATGGCCTCTCTGGATCAGCCTTGGAAGGTTCCAGGCTGCCCTTAGGCTCCC 

ACATTCTTCCCCAGTCACGCTCTCCTCGCCCTGCCCACACCAGTCCTGTGACCCTTGCCT 

GAGTTGTGACTTCCCACCCCTCCCCGGCCTAGAGGAAAGCTGCCTGGCCCCTCAGTGGGA 

CTCCCGCCCACTGACCCTCTGTCCACCATACACAGACAGGGGCACTATCCACAAGGTGGT 

GGAACCGGGGGAGCAGGAGCACAGCTTCGCCTTCAACATCATGGAGATCCAGCCCTTCCG 

CCGCGCGGCTGCCATCCAGACCATGTCGCTGGATGCTGAGCGGGTGAGCCTTCCCCCACT 
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GCGTCCCATGGGCTATGCAGTGACTGCAGCTGAGGACAGGGCTCCTTTGCATGTGATTTG 
TGTGTTCTTTTAAGAGCTTCTAGGCCTTAGGGCCTGGACATTTAGGACTGAGTGTGGGGT 
s GGGGCCCGGGCCTGACCCAATCCTGCTGTCCTTCCAGAGGAAGCTGTATGTGAGCTCCCA 

GTGGGAGGTGAGCCAGGTGCCCCTGGACCTGTGTGAGGTCTATGGCGGGGGCTGCCACGG 
T T GCC T C AT GTCC C GAGACCCCT ACTGC GGC T GGGACCAGGGC CGC T GCATCTC CATCTA 
CAGCTCCGAACGGTACGTTGGCCGGGATCCCTCCGTCCCTGGGACAAGGTGGGCATGGGA 

10 C AGGGGGAGGTGT T GT C GGGC TGGAAGAGGT GGC GGT AC T GGGCCT T TCT T GT GGGACC T 

CC T CT C T AC T GGAACT GC AC TAGGGGTAAGGAT AT GAGGGTCAGGTC TGCAGCC T TGT AT 
CTGCTGATCCTCTTTCGTCCTTCCCACTCCAGGTCAGTGCTGCAATCCATTAATCCAGCC 
GAGCCACACAAGGAGTGTCCCAACCCCAAACCAGGTACCTGATCTGGCCCTGCTGGCGGC 
IS TGTGGCCCAATGAGTGGGGTACTGCCCTGCCCTGATTGTCCTGGTCTGAGGGAAACATGG 

CCTTGTCCTGTGGGCCCCAGGTACATGGGGCAGGATACAGTCCTGCAGAGGGAGCCCTCT 
TGGT GGGAT GAGCGAGACGGGAGAAAAAAGGAGGAC GCT GAGGGCTGGGT TCCCCACGTT 
CATTCAGAAGCCTTGTCCTGGGATCCCAGTCGGTGGGGAGGACACATCCTCCCCTGGGAG 
20 CTCTTTGTCCCTCCTCACGGCTGCTTCCCCACTGCCTCCCCAGACAAGGCCCCACTGCAG 

AAGGTTTCCCTGGCCCCAAACTCTCGCTACTACCTGAGCTGCCCCATGGAATCCCGCCAC 
GC C ACC T AC T CAT GGC GCC AC AAGGAGAAC GT GGAGCAGAGCT GCGAAC CT GGTCACC AG 

AGCCCCAACTGCATCCTGTTCATCGAGAACCTCACGGCGCAGCAGTACGGCCACTACTTC 
26 TGCGAGGCCCAGGAGGGCTCCTACTTCCGCGAGGCTCAGCACTGGCAGCTGCTGCCCGAG 

GACGGCATCATGGCCGAGCACCTGCTGGGTCATGCCTGTGCCCTGGCCGCCTCCCTCTGG 
CTGGGGGTGCTGCCCACACTCACTC T TGGCT T GCTGGTCCACTAGGGCCTCCCGAGGCTG 
GGCATGCCTCAGGCTTCTGCAGCCCAGGGCACTAGAACGTCTCACACTCAGAGCCGGCTG 

30 

GCCCGGGAGCTCCTTGCCTGCCACTTCTTCCAGGGGACAGAATAACCCAGTGGAGGATGC 

caggcctggagacgtccagccgcaggcggctgctgggccccaggtggcgcacggatggtg 

AGGGGC T GAGAAT GAGGGCAC C GAC T GT GAAGC T GGGGC ATCGAT GACCCAAGAC T T TAT 

35 CTTCTGGAAAATATTTTTCAGACTCCTCAAACTTGACTAAATGCAGCGATGCTCCCAGCC 

CAAGAGCCCATGGGTCGGGGAGTGGGTTTGGATAGGAGAGCTGGGACTCCATCTCGACCC 
TGGGGCTGAGGCCTGAGTCCTTCTGGACTCTTGGTACCCACATTGCCTCCTTCCCCTCCC 
TCTCTCATGGCTGGGTGGCTGGTGTTCCTGAAGACCCAGGGCTACCCTCTGTCCAGCCCT 
40 GTCCTCTGCAGCTCCCTCTCTGGTCCTGGGTCCCACAGGACAGCCGCCTTGCATGTTTAT 

TGAAGGATGTTTGCTTTCCGGACGGAAGGACGGAAAAAGCTCTGAAAAAAAAAAAAAAAA 

AAAAAAAA 

45 Tabelle 1 5: Nukleotidsequenz von pMelBacA-HSEMAL (6622bp) (SEQ ID NO: 42) 

1 GATATCATGG AGATAATTAA AATGATAACC ATCTCGCAAA TAAATAAGTA 
50 q 

51 TTTTACTGTT TTCGTAACAG TTTTGTAATA AAAAAACCTA TAAATATGAA 
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101 ATTCTTAGTC AACGTTGCCC TTGTTTTTAT GGTCGTATAC ATTTCTTACA 
151 TCTATGCGGA TCGATGG 

gga tccgcccagg gccacctaag gagcggaccc 
201 cgcatcttcg ccgtctggaa aggccatgta gggcaggacc gggtggactt 
251 tggccagact gagccgcaca cggtgctttt ccacgagcca ggcagctcct 
301 ctgtgtgggt gggaggacgt ggcaaggtct acctctttga cttccccgag 
351 ggcaagaacg catctgtgcg cacggtgaat atcggctcca caaaggggtc 
401 ctgtctggat aagcgggact gcgagaacta catcactctc ctggagaggc 
451 ggagtgaggg gctgctggcc tgtggcacca acgcccggca ccccagctgc 
501 tggaacctgg tgaatggcac tgtggtgcca cttggcgaga tgagaggcta 
551 tgcccccttc agcccggacg agaactccct ggttctgttt gaaggggacg 
601 aggtgtattc caccatccgg aagcaggaat acaatgggaa gatccctcgg 
651 ttccgccgca tccggggcga gagtgagctg tacaccagtg atactgtcat 
701 gcagaaccca cagttcatca aagccaccat cgtgcaccaa gaccaggctt 
751 acgatgacaa gatctactac ttcttccgag aggacaatcc tgacaagaat 
801 cctgaggctc ctctcaatgt gtcccgtgtg gcccagttgt gcagggggga 
851 ccagggtggg gaaagttcac tgtcagtctc caagtggaac acttttctga 
901 aagccatgct ggtatgcagt gatgctgcca ccaacaagaa cttcaacagg 
951 ctgcaagacg tcttcctgct ccctgacccc agcggccagt ggagggacac 
1001 cagggtctat ggtgttttct ccaacccctg gaactactca gccgtctgtg 
1051 tgtattccct cggtgacatt gacaaggtct tccgtacctc ctcactcaag 
1101 ggctaccact caagccttcc caacccgcgg cctggcaagt gcctcccaga 
1151 ccagcagccg atacccacag agaccttcca ggtggctgac cgtcacccag 
1201 aggtggcgca gagggtggag cccatggggc ctctgaagac gccattgttc 
1251 cactctaaat accactacca gaaagtggcc gttcaccgca tgcaagccag 
1301 ccacggggag acctttcatg tgctttacct aactacagac aggggcacta 
1351 tccacaaggt ggtggaaccg ggggagcagg agcacagctt cgccttcaac 
1401 atcatggaga tccagccctt ccgccgcgcg gctgccatcc agaccatgtc 
1451 gctggatgct gagcggagga agctgtatgt gagctcccag tgggaggtga 
1501 gccaggtgcc cctggacctg tgtgaggtct atggcggggg ctgccacggt 
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1551 tgcctcatgt cccgagaccc ctactgcggc tgggaccagg gccgctgcat 
1601 ctccatctac agctccgaac ggtcagtgct gcaatccatt aatccagccg 
1651 agccacacaa ggagtgtccc aaccccaaac cagacaaggc cccactgcag 
1701 aaggtttccc tggccccaaa ctctcgctac tacctgagct gccccatgga 
1751 atcccgccac gccacctact catggcgcca caaggagaac gtggagcaga 
1801 gctgcgaacc tggtcaccag agccccaact gcatcetgtt catcgagaac 
1851 ctcacggcgc agcagtacgg ccactacttc tgcgaggccc aggagggctc 
1901 ctacttccgc gaggctcagc actggcagct gctgcccgag gacggcatca 
1951 tggccgagca cctgctgggt catgcctgtg ccctggctgc ctgaattc 

GA 

2001 AGCTTGGAGT CGACTCTGCT GAAGAGGAGG AAATTCTCCT TGAAGTTTCC 
2 051 CTGGTGTTCA AAGTAAAGGA GTTTGCACCA GACGCACCTC TGTTCACTGG 
2101 TCCGGCGTAT TAAAACACGA TACATTGTTA TTAGTACATT TATTAAGCGC 
2151 TAGATTCTGT GCGTTGTTGA TTTACAGACA ATTGTTGTAC GTATTTTAAT 
2201 AATTCATTAA ATTTATAATC TTTAGGGTGG TATGTTAGAG CGAAAATCAA 
2251 ATGATTTTCA GCGTCTTTAT ATCTGAATTT AAATATTAAA TCCTCAATAG 
2301 ATTTGTAAAA TAGGTTTCGA TTAGTTTCAA AC AAGGGTT G TTTTTCCGAA 
2351 CCGATGGCTG GACTATCTAA TGGATTTTCG CTCAACGCCA CAAAACTTGC 
2401 CAAATCTTGT AGCAGCAATC TAGCTTTGTC GATATTCGTT TGTGTTTTGT 
2451 TTTGTAATAA AGGTTCGACG TCGTTCAAAA TATTATGCGC TTTTGTATTT 
2501 CTTTCATCAC TGTCGTTAGT GTACAATTGA CTCGACGTAA ACACGTTAAA 
2551 TAAAGCCTGG ACATATTTAA CATCGGGCGT GTTAGCTTTA TTAGGCCGAT 
2601 TATCGTCGTC GTCCCAACCC TCGTCGTTAG AAGTTGCTTC CGAAGACGAT 
2 651 TTTGCCATAG CCACACGACG CCTATTAATT GTGTCGGCTA ACACGTCCGC 
2701 GATCAAATTT GTAGTTGAGC TTTTTGGAAT TATTTCTGAT TGCGGGCGTT 
2751 TTTGGGCGGG TTTCAATCTA ACTGTGCCCG ATTTTAATTC AGACAACACG 
2 8 01 TTAGAAAGCG ATGGTGCAGG CGGTGGTAAC ATTTCAGACG GCAAATCTAC 
2 851 TAATGGCGGC GGTGGTGGAG C T GAT GAT AA ATCTACCATC GGTGGAGGCG 
2901 CAGGCGGGGC TGGCGGCGGA GGCGGAGGCG GAGGTGGTGG CGGTGATGCA 
2 951 GACGGCGGTT TAGGCTCAAA TTGTCTCTTT CAGGCAACAC AGTCGGCACC 
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3001 TCAACTATTG TACTGGTTTC GGGCGTATGG TGCACTCTCA GTACAATCTG 
3051 CTCTGATGCC GCATAGTTAA GCCAGCCCCG ACACCCGCCA ACACCCGCTG 
3101 ACGCGCCCTG ACGGGCTTGT CTGCTCCCGG CATCCGCTTA CAGACAAGCT 
3151 GTGACCGTCT CCGGGAGCTG CATGTGTCAG AGGTTTTCAC CGTCATCACC 
32 01 GAAACGCGCG AGACGAAAGG GCCTCGTGAT ACGCCTATTT TTATAGGTTA 
3251 ATGTCATGAT AATAATGGTT TCTTAGACGT CAGGTGGCAC TTTTCGGGGA 
3301 AATGTGCGCG GAACCCCTAT TTGTTTATTT TTCTAAATAC ATTCAAATAT 
3351 GTATCCGCTC AT GAGACAAT AACCCTGATA AATGCTTCAA TAATATTGAA 
3401 AAAGGAAGAG TATGAGTATT CAACATTTCC GTGTCGCCCT TATTCCCTTT 
3451 TTTGCGGCAT TTTGCCTTCC TGTTTTTGCT CACCCAGAAA CGCTGGTGAA 
35 01 AGTAAAAGAT GCTGAAGATC AGTTGGGTGC ACGAGTGGGT T AC AT CGAAC 
3551 TGGATCTCAA CAGCGGTAAG ATCCTTGAGA GTTTTCGCCC CGAAGAACGT 
3601 TTTCCAATGA TGAGCACTTT TAAAGTTCTG CTATGTGGCG CGGTATTATC 
3651 CCGTATTGAC GCCGGGCAAG AGCAACTCGG TCGCCGCATA CACTATTCTC 
3701 AGAATGACTT GGTTGAGTAC TCACCAGTCA CAGAAAAGCA TCTTACGGAT 
3751 GGCATGACAG T AAGAGAAT T ATGCAGTGCT GCCATAACCA TGAGTGATAA 
3801 C ACT GCGGCC AACTTACTTC TGACAACGAT CGGAGGACCG AAGGAGCTAA 
3851 CCGCTTTTTT GCACAACATG GGGGATCATG TAACTCGCCT TGATCGTTGG 
3901 GAACCGGAGC TGAATGAAGC CATACCAAAC GACGAGCGTG ACACCACGAT 
3951 GCCTGTAGCA ATGGCAACAA CGTTGCGCAA ACTATTAACT GGCGAACTAC 
4001 TTACTCTAGC TTCCCGGCAA CAATTAATAG ACTGGATGGA GGCGGATAAA 
4051 GTTGCAGGAC CACTTCTGCG CTCGGCCCTT CCGGCTGGCT GGTTTATTGC 
4101 TGATAAATCT GGAGCCGGTG AGCGTGGGTC TCGCGGTATC ATTGCAGCAC 
4151 TGGGGCCAGA TGGTAAGCCC TCCCGTATCG TAGTTATCTA CACGACGGGG 
4201 AGTCAGGCAA CTATGGATGA ACGAAATAGA CAGATCGCTG AGATAGGTGC 
4251 CTCACTGATT AAGCATTGGT AACTGTCAGA CCAAGTTTAC TCATATATAC 
4301 TTTAGATTGA TTTAAAACTT CATTTTTAAT TTAAAAGGAT CTAGGTGAAG 
4351 ATCCTTTTTG ATAATCTCAT GACCAAAATC CCTTAACGTG AGTTTTCGTT 
4401 CCACTGAGCG TCAGACCCCG TAGAAAAGAT CAAAGGATCT TCTTGAGATC 
4451 CTTTTTTTCT GCGCGTAATC TGCTGCTTGC AAACAAAAAA ACCACCGCTA 



55 




EP 0 892 047 A2 



4501 CCAGCGGTGG TTTGTTTGCC GGATCAAGAG CTACCAACTC TTTTTCCGAA 
4551 GGTAACTGGC TTCAGCAGAG CGCAGATACC AAATACTGTT CTTCTAGTGT 
5 4 601 AGCCGTAGTT AGGCCACCAC TTCAAGAACT CTGTAGCACC GCCTACATAC 

4 651 CTCGCTCTGC TAATCCTGTT ACCAGTGGCT GCTGCCAGTG GCGATAAGTC 
4701 GTGTCTTACC GGGTTGGACT CAAGACGATA GTTACCGGAT AAGGCGCAGC 

10 

4751 GGTCGGGCTG AACGGGGGGT TCGTGCACAC AGCCCAGCTT GGAGCGAACG 

4801 ACCTACACCG AACTGAGATA CCTACAGCGT GAGCTATGAG AAAGCGCCAC 

4851 GCTTCCCGAA GGGAGAAAGG CGGACAGGTA TCCGGTAAGC GGCAGGGTCG 
15 

4901 GAACAGGAGA GCGCACGAGG GAGCTTCCAG GGGGAAACGC CTGGTATCTT 
4951 TATAGTCCTG TCGGGTTTCG CCACCTCTGA CTTGAGCGTC GATTTTTGTG 
2Q 5001 ATGCTCGTCA GGGGGGCGGA GCCTATGGAA AAACGCCAGC AACGCGGCCT 

5051 TTTTACGGTT CCTGGCCTTT TGCTGGCCTT TTGCTCACAT GTTCTTTCCT 
5101 GCGTTATCCC CTGATTCTGT GGATAACCGT ATTACCGCCT TT GAGTGAGC 
25 5151 TGATACCGCT CGCCGCAGCC GAACGACCGA GCGCAGCGAG TCAGTGAGCG 

5 201 AGGAAGC AT C CTGCACCAT C GTCTGCTCAT CCATGACCTG ACCAT GCAGA 
5251 GGATGATGCT CGTGACGGTT AACGCCTCGA ATCAGCAACG GCTTGCCGTT 
30 5 3 01 CAGCAGCAGC AGACCATTTT CAATCCGCAC CTCGCGGAAA CCGACATCGC 

5 351 AGGCTTCTGC TTCAATCAGC GTGCCGTCGG CGGTGTGCAG TTCAACCACC 
5401 GC AC GAT AG A GATTCGGGAT TTCGGCGCTC CACAGTTTCG GGTTTTCGAC 
5 451 GTTCAGACGT AGTGTGACGC GATCGGTATA ACCACCACGC TCATCGATAA 
5501 TTTCACCGCC GAAAGGC GCG GTGCCGCTGG CGACCTGCGT TTCACCCTGC 
5551 CATAAAGAAA CTGTTACCCG TAGGTAGTCA CGCAACTCGC CGCACATCTG 

40 

5 601 AACTTCAGCC TCCAGTACAG CGCGGCTGAA ATCATCATTA AAGCGAGTGG 

5651 CAACATGGAA ATCGCTGATT TGTGTAGTCG GTTTATGCAG C AAC GAG AC G 

t 5701 TCACGGAAAA TGCCGCTCAT CCGCCACATA TCCTGATCTT CCAGATAACT 

45 

5751 GCCGTCACTC CAACGCAGCA CCATCACCGC GAGGCGGTTT TCTCCGGCGC 
5801 GTAAAAATGC GCTCAGGTCA AATTCAGACG GCAAACGACT GTCCTGGCCG 
50 5851 TAACCGACCC AGCGCCCGTT GCACCACAGA TGAAACGCCG AGTTAACGCC 

5901 ATCAAAAATA ATTCGCGTCT GGCCTTCCTG TAGCCAGCTT TCATCAACAT 

55 



56 
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5951 


TAAATGTGAG 




6001 


GGATTGACCG 


5 




6051 


ACCGTGCATC 




6101 


GATCGCACTC 


10 


6151 


GCAAAGCGCC 




6201 


GGTGCGGGCC 




6251 


CAAGGCGATT 


15 


6301 


AAAACGAC GG 




6351 


TTTGATACAA 




6401 


CGTGCATGTT 


20 




6451 


GTTGCACATC 




6501 


GCAAGTTGGA 


25 


6551 


CCTACGAACG 




6601 


TTTTTCGTGT 



30 



35 



40 



45 



50 



55 



CGAGTAACAA CCCGTCGGAT 
TAATGGGATA GGTCACGTTG 
TGCCAGTTTG AGGGGACGAC 
CAGCCAGCTT TCCGGCACCG 
ATTCGCCATT CAGGCTGCGC 
TCTTCGCTAT TACGCCAGCT 
AAGTTGGGTA ACGCCAGGGT 
GATCTATCAT TTTTAGCAGT 
CTAATTTTAC GACGACGATG 
TGCAATCGTG CAAGCGTTAT 
AACAGGCTGG ACACCACGTT 
CCCGCCGCGC ATCCAATGCA 
ATTGATTCTT TGTCCATTGA 
CCAGTGTGGC TT 



TCTCCGTGGG AACAAACGGC 
GTGTAGATGG GCGCATCGTA 
GACAGTATCG GCC TCAGGAA 
CTTCTGGTGC C GGAAACCAG 
AACTGTTGGG AAGGGCGATC 
GGCGAAAGGG GGATGTGCTG 
TTTCCCAGTC ACGACGTTGT 
GATTCTAATT GCAGCTGCTC 
CGAGCTTTTA TTCAACCGAG 
caatttttca TTATCGTATT 
GAACTCGCCG CAGTTTTGCG 
AACTTTCCGA CATTCTGTTG 
TCGAAGCGAG TGCCTTCGAC 
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S EQUEN 2 PROTOKOLL 



s (1) ALLGEMEINE INFORMATION: 

(i) ANMELDER : 

(A) NAME: Hoechst Marion Roussel Deutschland GmbH 

(B) STRASSE: - 

(C) ORT: Frankfurt 

10 (D) BUNDESLAND: - 

(E) LAND: Deutschland 

(F) POSTLEITZAHL: 65926 

(G) TELEPHON: 069-305-7072 

(H) TELEFAX: 069-35-7175 

IS (I) TELEX: - 

(ii) ANMELDETITEL : Humane s Semaphorin L (H-Sema-L) und 
korrespondierende Semaphorine in anderen Spezies 

20 (iii) ANZAHL DER SEQUENZEN: 44 

(iv) COMPUTER- LESBARE FORM: 

(A) DATENTRAgER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBS SYSTEM: PC-DOS/MS-DOS 

: (D) SOFTWARE: Patentln Release #1.0, Version #1.25 (EPA) 



30 



(2) INFORMATION ZU SEQ ID NO: 1: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 2636 Basenpaare 

(B) ART: Nukleins&ure 

(C) STRANQFORM: Einzel 

(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..2636 



45 



50 



55 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 1: 

CGGGG CCACG GGATGACGCC TCCTCCGCCC GGACGTGCCG CCCCCAGCGC ACCGCGCGCC 
CGCGTCCCTG GCCCGCCGGC TCGGTTGGGG CTTCCGCTGC GGCTGCGGCT GCTGCTGCTG 
CTCTGGGCGG CCGCCGCCTC CGCCCAGGGC CACCTAAGGA GCGGACCCCG CATCTTCGCC 
GTCTGGAAAG GCCATGTAGG GCAGGACCGG GTGGACTTTG GCCAGACTGA GCCGCACACG 
gtgcttttcc ACGAGCCAGG CAGCTCCTCT GTGTGGGTGG GAGGACGTGG CAAGGTCTAC 



60 

120 

160 

240 

300 
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5 



10 



IS 



20 



25 



30 



35 



40 



45 



50 



CTCTTTGACT TCCCCGAGGG CAAGAACGCA TCTGTGCOCA CGGTGAATAT CGGCTCCACA 
AAGGGGTCCT GTCTGGATAA GCGGGACTGC GAGAACTACA TCACTCTCCT GGAGAGGCGG 

agtgaggggc tgctggcctg tggcaccaac GCCCGGCACC ccagctgctg gaacctggtg 
aatcgcactg tggtgccact tggcgagatg agaggctacg cccccttcag cccggacgag 
aactccctgg ttctgtttga aggggacgag qtgtattcca ccatccggaa gcaggaatac 
aatgggaaga tccctcggtt ccgccgcatc cggggcgaga gigagctcta caccagtgat 
actgtcatgc agaacccaca gttcatcaaa gccaccatcg tgcaccaaga ccaggcttac 
gatgacaaga tctactactt cttccgagag gacaatcctg acaagaatcc toaggctcct 
ctcaatgtgt cccgtgtggc ccagttgtgc aggggggacc aggg^ggga aagttcactg 

TCAGTCTCCA AGTGGAACAC TTTTCTGAAA GCCATGCTGG TATGCAGTGA TGCTOCCACC 
aacaagaact TCAACAGGCT GCAAGACGTC ttcctgctcc CTGACCCCAG CGGCCAGTGG 
AGGGACACCA GGGTCTATGG TGTTTTCTCC AACCCCTGGA ACTACTCAGC CGTCTGTGTG 

tattccctcg gtgacattga caaggtcttc cgtacctcct cactcaagcg ctaccactca 
agccttccca acccgcggcc tggcaagtgc ctcccagacc agcagccgat acccacagag 
accttccagg tggctgaccg tcacccagag gtggcgcaga gggtggagcc catggggcct 

CTGAAGACGC CATTGTTCCA CTCTAAATAC CACTACCAGA AAGTGGCCGT TCACOGCATG 
CAAGCCAGCC ACGGGGAGAC CTTTCATGTG CTTTACCTAA CTACAGACAG GGGCACTATC 
CACAAGGTGG TGGAACCGGG QGAGCAGGAG CACAGCTTCG CCTTCAACAT CATGGAGATC 
CAGCCCTTCC GCCGCGCGGC TGCCATCCAG ACCATGTCGC TGGATGCTGA GCGGAGGAAG 

ctgtatgtga gctcccagtg ggaggtgagc caggxgcccc tggacctgtg tgagg^tat 

GGCGGGGGCT GCCACGGTTG CCTCATGTCC CGAGACCCCT ACTGCGGCTG GGACCAGGGC 

CGCTGCATCT ccatctacag ctccgaacgg tcagtgogc aatccattaa tccagccgag 



360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 



CCACACAAGG AGTGTCCCAA CCCCAAACCA 
GCCCCAAACT CT CGCTACTA CCTGAGCTGC 
TGGCGCCACA AGGAGAACGT GGAGCAGAGC 



GACAAGGCCC CACTGCAGAA GGTTTCCCTG 
CCCATGGAAT CCCGCCACGC CACCTACTCA 
TGCGAACCTG GTCACCAGAG CCCCAACTGC 



ATCCTGTTCA TCGAGAACCT CACGGCGCAG 
GAGGGCTCCT ACTTCCGCGA GGCTCAGCAC 
GCCGAGCACC TGCTGGGTCA TGCCTGTGCC 



CAGTACGGCC ACTACTTCTG CGAGGCCCAG 
TGGCAGCTGC TGCCCGAGGA CGGCATCATG 
CTGGCTGCCT CCCTCTGGCT GGGGGTGCTG 



1680 

1740 

1800 

.1860 

1920 

1980 
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CCCACACTCA CTCTTGGCTT GCTGGTCCAC TAGGGCCTCC CGAGGCTGGG CATGCCTCAG 
GCTTCTGCAG CCCAGGGCAC TAGAACGTCT CACACTCAGA GCCGGCTGGC CCGGGAGCTC 
CTTGCCTGCC ACTTCTTCCA GGGGACAGAA TAACCCAGTG GAGGATGCCA GGCCTGGAGA 
CGTCCAGCCG CAGGCGGCTG CTGGGCCCCA GGTGGCGCAC GGATGGTGAG GGGCTGAGAA 
TGAGGGCACC GACTGTGAAG CTGGGGCATC GATGACCCAA GACTTTATCT TCTGGAAAAT 
ATTTTTCAGA CTCCTCAAAC TTGACTAAAT GCAGCGATGC TCCCAGCCCA AGAGCCCATG 
ggtcggggag tgggtttgga taggagagct gggactccat CTCGACCCTG GGGCTGAGGC 
CTGAGTCCTT CTGGACTCTT GGTACCCACA TTGCCTCCTT CCCCTCCCTC TCTCATGGCT 
GGGTGGCTGG tgttcctgaa GACCCAGGGC taccctctgt ccagccctgt cctctgcagc 
TCCCTCTCTG GTCCTGGGTC CCACAGGACA GCCGCCTTGC ATGTTTATTG AAGGATGTTT 
GCTTTCCGGA CGGAAGGACG GAAAAAGCTC TGAAAAAAAA AAAAAAAAAA AAAAAA 

(2) INFORMATION ZU SEQ ID NO: 2: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1195 Basenpaare 

(B) ART: Nukleineaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK0LS : DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..1195 

(xi) SBQUENZBESCHREIBUNG: SEQ ID NO; 2: 

CGGGGCTGCG GGATGACGCC TCCTCCTCCC GGACGTGCCG CCCCCAGCGC ACCGCGCGCC 
CGCGTCCTCA GCCTGCCGGC TCGGTTCGGG CTCCCGCTGC GGCTGCGGCT TCTGCTGGTG 
TTCTGGGTGG CCGCCGCCTC CGCCCAAGGC CACTCGAGGA GCGGACCCCG CATCTCCGCC 
GTCTGGAAAG GGCAGGACCA TGTGGACTTT AGCCAGCCTG AGCCACACAC CGTGCTTTTC 
CATGAGCCGG GCAGCTTCTC TGTCTGGGTG GGTGGACGTG GCAAGGTCTA CCACTTCAAC 
TTCCCCGAGG GCAAGAATGC CTCTGTGCGC ACGGTGAACA TCGGCTCCAC AAAGGGGTCC 
TGTCAGGACA AACAGGACTG TGGGAATTAC ATCACTCTTC TAGAAAGGCG GGGTAATGGG 



2040 

2100 

2160 

2220 

2260 

2340 

2400 

2460 

2520 

2580 

2636 



60 

120 

180 

240 

300 

360 

420 
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CTGCTGGTCT GTGGCACCAA TGCCCGGAAG CCCAGCTGCT GGAACTTGGT GAATGACAGT 

GTGGTGATGT CACTTGGTGA GATGAAAGGC TATGCCCCCT TCAGCCCGGA TGAGAACTCC 
5 

CTGGTTCTGT TTGAAGGAGA TGAAGTGTAC TCTACCATCC GGAAGCAGGA ATACAACGGG 

AAGATCCCTC GGTTTCGACG CATTCGGGGC GAGAGTGAAC TGTACACAAG TGATACAGTC 

10 ATGCAGAACC CAC AGTT CAT CAAGGCCACC ATTGTGCACC AAGACCAAGC CTATGATGAT 

AAGATCTACT ACTTCTTCCG AGAAGACAAC CCTGACAAGA ACCCCGAGGC TCCTCTCAAT 

GTGTCCCGAG TAGCCCAGTT GTGCAGGGGG GACCAGGGTG GTGAGAGTTC GTTGTCTGTC 
15 

TCCAAGTGGA ACACCTTCCT GAAAGCCATG TTGGTCTGCA GCGATGCAGC CACCAACAGG 
AACTTCAATC GGCTGCAAGA TGTCTTCCTG CTCCCTGACC CCAGTGGCCA GTGGAGAGAT 
2Q ACCAGGGTCT ATGGCGTTTT CTCCAACCCC TGGAACTACT CAGCTGTCTG CGTGTATTCG 

CTTGGTGACA TTGACAGAGT CTTCCGTACC TCATCGCTCA AAGGCTACCA CATGGGCCTT 
TCCAACCCTC GACCTGGCAT GTGCCTCCCA AAAAAGCAGC CCATACCCAC AGAAACCTTC 
c5 CAGGTAGCTG ATAGTCACCC AGAGGTGGCT CAGAGGGTGG AACCTATGGG GCCCC 



(2) INFORMATION ZU SEQ ID NO: 3: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 666 Aminos&uren 

(B) ART: Aminos^ure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOls : Protein 



40 



(ix) MERKMALE: 

(A) NAME/SCHLftSSEL; Protein 

(B) LAGE: 1..666 



45 



SO 



55 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 3: 

Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Arg Ala 
15 10 15 

Arg val Pro Gly Pro Pro Ala Arg Leu Gly Leu Pro Leu Arg Leu Arg 
20 25 30 

Leu Leu Leu Leu Leu Trp Ala Ala Ala Ala Ser Ala Gin Gly Hie Leu 
35 40 45 



480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1195 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



Arg Ser Gly Pro Arg He Phe Ala 
50 55 

Asp Arg Val Asp Phe Gly Gin Thr 
65 70 

Glu Pro Gly Ser Ser Ser Val Trp 
85 

Leu Phe Asp Phe Pro Glu Gly Lys 
100 

lie Gly Ser Thr Lys Gly Ser Cys 
115 120 

Tyr lie Thr Leu Leu Glu Arg Arg 
130 135 

Thr Asn Ala Arg His Pro Ser Cys 
145 150 

Val Pro Leu Gly Glu Met Arg Gly 
165 

Asn Ser Leu Val Leu Phe Glu Gly 
180 

Lys Gin Glu Tyr Asn Gly Lys lie 
195 200 

Glu Ser Glu Leu Tyr Thr Ser Asp 
210 215 

lie Lys Ala Thr lie Val His Gin 
225 230 

Tyr Tyr Phe Phe Arg Glu Asp Asn 
245 

Leu Asn Val Ser Arg Val Ala Gin 
260 

Glu Ser Ser Leu Ser Val Ser Lys 
275 280 

Leu Val Cys Ser Asp Ala Ala Thr 
290 295 



Val Trp Lys Gly His Val Gly Gin 
60 

Glu Pro His Thr Val Leu Phe His 
75 80 

Val Gly Gly Arg Gly Lys Val Tyr 
90 95 

Asn Ala Ser Val Arg Thr Val Asn 
105 110 

Leu Asp Lys Arg Asp Cys Glu Asn 
125 

Ser Glu Gly Leu Leu Ala Cys Gly 
140 

Trp Asn Leu Val Asn Gly Thr Val 
155 160 

Tyr Ala Pro Phe Ser Pro Asp Glu 
170 175 

Asp Glu Val Tyr Ser Thr lie Arg 
185 190 

Pro Arg Phe Arg Arg lie Arg Gly 
205 

Thr Val Met Gin Asn Pro Gin Phe 
220 

Asp Gin Ala Tyr Asp Asp Lys lie 
235 240 

Pro Asp Lys Asn Pro Glu Ala Pro 
250 255 

Leu Cys Arg Gly Asp Gin Gly Gly 
265 270 

Trp Asn Thr Phe Leu Lys Ala Met 
285 

Asn Lys Asn Phe Asn Arg Leu Gin 
300 



Asp Val Phe Leu Leu Pro Asp Pro Ser Gly Gin Trp Arg Asp Thr Arg 

305 310 315 320 

Val Tyr Gly Val Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val 

325 330 335 
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10 



15 



20 
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30 



35 



40 



46 



50 



Tyr Ser Leu Gly Asp lie Asp Lys 
340 

Gly Tyr His Ser Ser Leu Pro Asn 
3SS 360 

Asp Gin Gin Pro He Pro Thr Glu 
370 375 

Pro Glu Val Ala Gin Arg Val Glu 
385 390 

Leu Phe His Ser Lys Tyr His Tyr 
405 

Gin Ala Ser His Gly Glu Thr Phe 
420 

Arg Gly Thr lie His Lys Val Val 
435 440 

Phe Ala Phe Asn lie Met Glu lie 
450 455 

lie Gin Thr Met Ser Leu Asp Ala 
465 470 

Ser Gin Trp Glu Val Ser Gin Val 
485 

Gly Gly Gly Cys His Gly Cys Leu 
500 

Trp Asp Gin Gly Arg Cys lie Ser 
515 520 

Leu Gin Ser lie Asn Pro Ala Glu 
530 535 

Lys Pro Asp Lys Ala Pro Leu Gin 
545 550 

Arg Tyr Tyr Leu Ser Cys Pro Met 
565 

Trp Arg His Lys Glu Asn Val Glu 
580 

Ser Pro Asn Cys lie Leu Phe lie 
595 600 

Gly His Tyr Phe Cys Glu Ala Gin 
610 615 



Val Phe Arg Thr Ser Ser Leu Lys 
345 350 

Pro Arg Pro Gly Lys Cys Leu Pro 
365 

Thr Phe Gin Val Ala Asp Arg His 
380 

Pro Met Gly Pro Leu Lys Thr Pro 
395 400 

Gin Lys Val Ala Val His Arg Met 
410 415 

His Val Leu Tyr Leu Thr Thr Asp 
425 430 

Glu Pro Gly Glu Gin Glu His Ser 
445 

Gin Pro Phe Arg Arg Ala Ala Ala 
460 

Glu Arg Arg Lys Leu Tyr Val Ser 
475 480 

Pro Leu Asp Leu Cys Glu Val Tyr 
490 495 

Met Ser Arg Asp Pro Tyr Cys Gly 
505 510 

lie Tyr Ser Ser Glu Arg Ser Val 
525 

Pro His Lys Glu Cys Pro Asn Pro 
540 

Lys Val Ser Leu Ala Pro Asn Ser 
555 560 

Glu Ser Arg His Ala Thr Tyr Ser 
570 575 

Gin Ser Cys Glu Pro Gly His Gin 
585 590 

Glu Asn Leu Thr Ala Gin Gin Tyr 
605 

Glu Gly Ser Tyr Phe Arg Glu Ala 
620 
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Gin 

625 


His 


Trp 


Gin 


Leu 


Leu 

630 


Pro 


Glu 


Asp 


Gly 


He 

635 


Met 


Ala 


Glu His 


Leu 

640 


Leu 


Gly His 


Ala 


Cys 

645 


Ala 


Leu 


Ala 


Ala 


Ser 

650 


Leu 


Trp 


Leu 


Gly Val 
655 


Leu 


Pro 


Thr 


Leu 


Thr 

660 


Leu 


Gly Leu 


Leu 


Val 

665 


His 













(2) INFORMATION ZU SEQ ID NO : 4: 



(i) SEQUENZ CHARAKTERI STIKA : 

(A) LANGE: 394 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEKULS: Protein 



( lx) MERKMALE: 

(A) NAME/SCHLUSSEL: Protein 

(B) LAGE: 1..394 



(xi) 


SEQUENZBESCHREIBUNG : 


: SEQ ID 


NO: 


4 : 














Met 


Thr 


Pro 


Pro 


Pro 


Pro Gly Arg 


Ala 


Ala 


Pro 


Ser 


Ala 


Pro Arg 


Ala 


1 








5 








10 










15 




Arg 


Val 


Leu 


Ser 


Leu 


Pro 


Ala Arg 


Phe 


Gly 


Leu 


Pro 


Leu 


Arg 


Leu 


Arg 








20 








25 










30 






Leu 


Leu 


Leu 


Val 


Phe 


Trp 


Val Ala 


Ala 


Ala 


Ser 


Ala 


Gin Gly 


His 


Ser 






35 








40 










45 








Arg 


Ser 


Gly 


Pro 


Arg 


lie 


Ser Ala 


Val 


Trp 


Lys 


Gly 


Gin 


Asp 


His 


val 




50 










55 








60 










Asp 


Phe 


Ser 


Gin 


Pro 


Glu 


Pro His 


Thr 


Val 


Leu 


Phe 


His 


Glu 


Pro 


Gly 


65 










70 








75 










GO 


Ser 


Phe 


Ser 


Val 


Trp 


Val 


Gly Gly 


Arg 


Gly 


Lys 


Val 


Tyr 


His 


Phe 


Asn 










65 








90 










95 




Phe 


Pro 


Glu 


Gly 


Lys 


Asn 


Ala Ser 


Val 


Arg 


Thr 


Val 


Asn 


lie 


Gly 


Ser 








100 








105 










110 






Thr 


Lys 


Gly 


Ser 


Cys 


Gin 


Asp Lys 


Gin 


Asp 


Cys 


Gly 


Asn 


Tyr 


lie 


Thr 






115 








120 










125 








Leu 


Leu 


Glu 


Arg 


Arg 


Gly Asn Gly 


Leu 


Leu 


Val 


Cys 


Gly 


Thr 


Asn 


Ala 



130 135 140 
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5 



10 



15 



20 



25 



30 



35 



40 



45 



50 



Arg Lys Pro Ser Cys Trp Asn Leu 
145 150 

Leu Gly Glu Met Lys Oly Tyr Ala 
165 

Leu Val Leu Phe Glu Gly Asp Glu 
180 

Glu Tyr Aon Gly Lys lie Pro Arg 
195 200 

Glu Leu Tyr Thr Ser Asp Thr Val 
210 215 

Ala Thr lie Val His Gin Asp Gin 
225 230 

Phe Phe Arg Glu Asp Asn Pro Asp 
245 

Val Ser Arg Val Ala Gin Leu Cys 
260 

Ser Leu Ser Val Ser Lys Trp Asn 
275 200 

Cys Ser Asp Ala Ala Thr Asn Arg 
290 295 

Phe Leu Leu Pro Asp Pro Ser Gly 
305 310 

Gly Val Phe Ser Asn Pro Trp Asn 
325 

Leu Gly Asp lie Asp Arg Val Phe 
340 

His Met Gly Leu Ser Asn Pro Arg 
355 360 

Gin Pro lie Pro Thr Glu Thr Phe 
370 375 

Val Ala Gin Arg Val Glu Pro Met 
385 390 



Val Asn Asp Ser Val Val Met Ser 
155 160 

Pro Phe Ser Pro Asp Glu Asn Ser 
170 175 

Val Tyr Ser Thr lie Arg Lys Gin 
185 190 

Phe Arg Arg lie Arg Gly Glu Ser 
205 

Met Gin Asn Pro Gin Phe He Lys 
220 

Ala Tyr Asp Asp Lys lie Tyr Tyr 
235 240 

Lys Asn Pro Glu Ala Pro Leu Asn 
250 255 

Arg Gly Asp Gin Gly Gly Glu Ser 
265 270 

Thr Phe Leu Lys Ala Met Leu Val 
285 

Asn Phe Asn Arg Leu Gin Asp Val 
300 

Gin Trp Arg Asp Thr Arg Val Tyr 
315 320 

Tyr Ser Ala Val Cys Val Tyr Ser 
330 335 

Arg Thr Ser Ser Leu Lys Gly Tyr 
345 350 

Pro Gly Met Cys Leu Pro Lys LyB 
365 

Gin Val Ala Asp Ser His Pro Glu 
380 

Gly Pro 
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(2) INFORMATION ZU SEQ ID NO : 5: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) Il&NOE: 23 Basenpaare 

(B) ART: NukleinsSure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK0LS : DNS (genomiach) 

(ix) MERKMALB: 

(A) NAME/ SCHLOSSEL : exon 

(B) LAGE: 1..23 

(Xi) SEQUBNZBESCHREIBUNG: SEQ ID NO : 5: 
ACTCACTATA GGGCTCGAGC GGC 



(2) INFORMATION ZU SEQ ID NO: 6: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: NukleinscLure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK0LS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL : exon 

(B) LAGE: 1..20 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO : 6: 
AGCCGCACAC GGTGCTTTTC 



40 (2) INFORMATION ZU SEQ ID NO : 7: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

45 <C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 

50 (ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..20 



23 



20 
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(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 



GCACAGATGC GTTCTTGCCC 



(2) INFORMATION ZU SEQ ID NO: 8; 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: NuJcleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOlS : DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/ SCHLOSSEL : exon 

(B) LAGE: 1..20 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 8 
ACCATAGACC CTGGTGTCCC 



(2) INFORMATION ZU SEQ ID NO: 9: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 



(ix) MERKMALE; 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..20 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 
GCAGTGATGC TGCCACCAAC 



(2) INFORMATION ZU SEQ ID NO: 10: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleins&ure 
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(C) STRANGFORM: Einzel 

(D) TOPOLOGIE : linear 

5 (ii) ART DES MOLEK&LS: DNS (genomisch) 



10 



(ix) MERKMALE : 

(A) NAME/SCHLUSSEL: exon 
<B) LAGS : 1..20 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 10: 
IS CCAGACCATG TCGCTGGATG 



20 



(2) INFORMATION ZU SEQ ID NO: 11: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: NukleinsAure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..20 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 11: 

ACATGAGGCA ACCGTGGCAG 20 



(2) INFORMATION ZU SEQ ID NO : 12: 

40 (i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 27 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 
45 

(ii) ART DES MOLEKULS: DNS (genomisch) 



50 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 
CCATCCTAAT ACGACTCACT ATAGGGC 



27 
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(2) INFORMATION ZU SEQ ID NO: 13: 



5 (i) SEQUENZ CHARAKTERISTIKA : 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM; Einzel 

(D) TOPOLOGIE : linear 

10 

(ii) ART DES MOLEK0LS: DNS (genomisch) 



15 



(lx) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..20 



(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 
AGGTAGACCT TGCCACGTCC 



20 



(2) INFORMATION ZU SEQ ID NO: 14: 

25 (i) SEQUENZ CHARAKTERISTIKA: 

(A) L&NGE: 23 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 
30 

(ii) ART DES MOLEKtfLS : DNS (genomisch) 
(ix) MERKMALE: 

35 (A) NAME/ SCHLOSSEL : exon 

(B) LAGE: 1..23 



40 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 
GAACTTCAAC AGGCTGCAAG ACG 



23 



(2) INFORMATION ZU SEQ ID NO: 15: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 
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(ix) MERKMALE: 

(A) NAME/SCHLftSSEL : exon 

(B) LAGE: 1..20 
5 

(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 
ATGCTGAGCG GAGGAAG CTG 

10 



(2) INFORMATION ZU SEQ ID NO: 16: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleins&ure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomiBch) 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 16: 

CCGCCATACA CCTCACACAG 

25 



(2) INFORMATION ZU SEQ ID NO: 17: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE : 28 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..2 8 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 
CTGGAAGCTT TCTGTGGGTA TCGGCTGC 



(2) INFORMATION ZU SEQ ID NO: 18: 

( i ) SEQUENZ CHARAKTER I S TI KA : 

(A) LANGE: 25 Basenpaare 

(B) ART: NukleinsAure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 
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(ii) ART DES MOLEKULS: DNS (genomisch) 



5 (ix) MERKMALB: 

(A) NAME/SCHLUSSEL: exon 

(B) liAGE: 1..25 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 

TTTGGATCCC TGGTTCTGTT TGAAQ 



is (2) INFORMATION ZU SEQ ID NO: 19: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 50 Basenpaare 

(B) ART: Nukleins&ure 

(C) STRANGFORM: Einzel 

20 (d) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



25 { ix ) MERKMALiE : 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..50 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 

TTCTAGAATT CAGCGGCCGC TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT 



(2) INFORMATION ZU SEQ ID NO: 20: 

35 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 27 Basenpaare 

(B) ART: NukleinsSure 

(C) STRANGFORM: Einzel 

40 (D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..27 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 20: 

GGGGAAAGTT CACTGTCAGT CTCCAAG 
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(2) INFORMATION ZU SEQ ID NO: 21: 

(i) SEQUENZ CHARAKTERISTIKA : 

5 (A) LANGE: 26 Basenpaare 

(B) ART: NukleinsAure 

( C ) STRANGFORM : E inze 1 

(D) TOPOLOGIE: linear 

10 (ii) ART DES MOLEKULS: DNS (genomisch) 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21 
15 GGGAATACAC ACAGACGGCT GAGTAG 



20 



25 



(2) INFORMATION ZU SEQ ID NO : 22: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: NukleinscLure 

(C) STRANGFORM: Binzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKClS: DNS (genomisch) 



30 



(ix) MERKMALB: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..22 



35 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 22: 
AGCAAGTTCA GCCTGGTTAA GT 



(2) INFORMATION ZU SEQ ID NO: 23: 

40 

( i ) SEQUENZ CHARAKTERI STI KA : 

(A) LANGE: 21 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

45 (D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



50 (ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .21 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 23 

TTATGAGTAT TTCTTCCAGG G 
5 



(2) INFORMATION ZU SEQ ID NO: 24: 

(i) SBQUENZ CHARAKTERISTIKA : 

(A) LANGE: 26 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomiflch) 



( ix) MERKMALE : 

(A) NAME/SCHLUSSEL: exon 

(B) LAGS: 1..26 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24: 
CCATTAATC C AGCCGAGCCA CACAAG 



(2) INFORMATION ZU SEQ ID NO: 25: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 25 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE; linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..25 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 
CAT CT ACAGC TCCGAACGGT CAGTG 



(2) INFORMATION ZU SEQ ID NO: 26: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) L&NGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 
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{ ii ) art DES MOLEK0LS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..20 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 
CAGCGGAAGC CCCAACCGAG 



IS 



20 



(2) INFORMATION ZU SEQ ID NO: 27: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 23 Basenpaare 

(B) ART: Nukleins&ure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEK&LS : DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..23 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 27: 
GGGATGACGC CTCCTCCGCC CGG 



35 



40 



(2) INFORMATION ZU SEQ ID NO : 2B: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE : 31 Basenpaare 

(B) ART: Nukleins&ure 
(c) STRANGFORM: Einzel 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK&LS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..31 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 28 
AAGCTTCACG TGGACCAGCA AGC CAAGAGT G 



55 




EP 0 892 047 A2 



(2) INFORMATION ZU SEQ ID NO: 29 : 

(i) SEQUENZ CHARAKTERISTIKA; 

5 (A) LANGE : 25 Basenpaare 

(B) ART: NukleinsSure 

(C) STRANGFORM: Einzel 
<D) TOPOLOGIE: linear 

10 (ii) ART DBS MOLEKOLS: DNS (genomisch) 



is 



(lx) MERKMALE: 

(A) NAME/SCHLUSSEL : exon 

(B) LAGE: 1..25 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 29: 
20 AAGCTTTTTC CGTCCTTCCG TCCGG 



25 



25 



30 



(2) INFORMATION ZU SEQ ID NO: 30: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleins^ure 

(C) STRANGFORM: Einzel 

(D) TO PO LOGIE : linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



35 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..24 



40 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 30: 
ATGGTGAGCA AGGGCGAGGA GCTG 



(2) INFORMATION ZU SEQ ID NO : 31: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



24 
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(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE : 1..24 

5 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 31 
CTTGTACAGC TCGTCCATGC CGAG 

10 



(2) INFORMATION ZU SEQ ID NO: 32: 

( ± ) SEQUENZ CHARAKTERISTIKA : 

(A) LANGE: 25 Basenpaare 

(B) ART: Nukleins&ure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKftLS : DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/ SCHL0SSEL : exon 

(B) LAGE: 1..25 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO : 32 
GGGTGGTGAG AGTTCGTTGT CTGTC 



(2) INFORMATION ZU SEQ ID NO: 33: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 25 Basenpaare 

(B) ART: Nukleins&ure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLtfSSEL: exon 

(B) LAGE: 1..25 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 33 
GAG CGATGAG GTACGGAAGA CTCTG 
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(2) INFORMATION ZU SEQ ID NO : 34: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 5856 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKCLS : DNS (genomisch) 



(ix) MERKMALE: 

(A) NAMB/SCHLUSSEL: exon 

(B) LAGS: 1..5856 



(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: 





AGCGCCCAAT 


ACGCAAACCG 


CCTCTCCCCG 


CGCGTTGGCC 


GATTCATTAA 


TGCAGCTGGC 


60 


20 


ACGACAGGTT 


TCCCGACTGG 


AAAGCGGGCA 


GTGAGCGCAA 


CGCAATTAAT 


GTGAGTTAGC 


120 




TCACTCATTA 


GGCACCCCAG 


GCTTTACACT 


TTATGCTTCC 


GGCTCGTATG 


TTGTGTGGAA 


180 


25 


TTGTGAGCGG 


ATAACAATTT 


CACACAGGAA 


ACAGCTATGA 


CCATGATTAC 


GCCAAGCTTC 


240 


ACGTGGACCA 


GCAAGCCAAG 


AGTGAGTGTG 


GGCAGCACCC 


CCAGCCAGAG 


GGAGGCAGCC 


300 




AGGGCACAGG 


CATGACCCAG 


CAGGTGCTCG 


GCCATGATGC 


CGTCCTCGGG 


CAGCAGCTGC 


360 


30 


CAGTGCTGAG 


CCTCGCGGAA 


GTAGGAGCCC 


TCCTGGGCCT 


CGCAGAAGTA 


GTGGCCGTAC 


420 




TGCTGCGCCG 


TGAGGTTCTC 


GATGAACAGG 


ATGCAGTTGG 


GGCTCTGGTG 


ACCAGGTTCG 


480 




CAGCT CTGCT 


CCACGTTCTC 


CTTGTGGCGC 


CATGAGTAGG 


TGGCGTGGCG 


GGATTCCATG 


540 


35 


GGGCAGCTCA 


GGTAGTAGCG 


AGAGTTTGGG 


GCCAGGGAAA 


CCTTCTGCAG 


TGGGGCCTTG 


600 




TCTGGTTTGG 


GGTTGGGACA 


CTCCTTGTGT 


GGCTCGGCTG 


GATTAATGGA 


TTGCAGCACT 


660 


40 


GACCGTTCGG 


AGCTGTAGAT 


GGAGATGCAG 


CGGCCCTGGT 


CCCAGCCGCA 


GTAGGGGTCT 


720 


CGGGACATGA 


GGCAACCGTG 


GCAGCCCCCG 


CCATAGACCT 


CACACAGGTC 


CAGGGGCACC 


780 




TGGCTCACCT 


CCCACTGGGA 


GCTCACATAC 


AGCTTCCTCC 


GCTCAGCATC 


CAGCGACATG 


840 


45 


GTCTGGATGG 


CAGCCGCGCG 


GCGGAAGGGC 


TGGATCTCCA 


TGATGTTGAA 


GGCGAAGCTG 


900 




TGCTCCTGCT 


CCCCCGGTTC 


CACCACCTTG 


TGGATAGTGC 


CCCTGTCTGT 


AGTTAGGTAA 


960 




AGCACATGAA 


AGGTCTCCCC 


GTGGCTGGCT 


TGCATGCGGT 


GAACGGCCAC 


TTTCTGGTAG 


1020 


SO 


TGGTATTTAG 


AGTGGAACAA 


TGGCGTCTTC 


AGAGGCCCCA 


TGGGCTCCAC 


CCTCTGCGCC 


1060 




ACCTCTGGGT 


GACGGTCAGC 


CACCTGGAAG 


GTCTCTGTGG 


GTATCGGCTG 


CTGGTCTGGG 


1140 
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AGGCACTTGC CAGGCCGCGG GTTGGGAAGG CTTGAGTGGT AGCC CTTGAG TGAGGAGGTA 12 00 
CGGAAGACCT TGTCAATGTC AC CGAGGGAA TACACACAGA CGGCTGAGTA GTTCCAGGGG 1260 
TTGGAGAAAA CACCATAGAC CCTGGTGTCC CTCCACTGGC CGCTGGGGTC AGGGAGCAGG 1320 
AAGACGTCTT GCAGCCTGTT GAAGTTCTTG TTGGTGGCAG CATCACTGCA TACCAGCATG 1380 
G CTTTCAGAA AAGTGTTCCA CTTGGAGACT GACAGTGAAC TTTCCCCACC CTGGTCCCCC 1440 
CTGCACAACT GGGCCACACG GGACACATTG AG AGG AG C CT CAGGATTCTT GTCAGGATTG 1500 
TCCTCTCGGA AGAAGTAGTA GATCTTGTCA TCGTAAGCCT GGTCTTGGTG CACGATGGTG 1560 
GCTTTGATGA ACTGTGGGTT CTGCATGACA GTATCACTGG TGTACAGCTC ACTCTCGCCC 1620 
CGGATGCGGC GGAACCGAGG GATCTTCCCA TTGT ATT C CT GCTTC CGGAT GGTGGAATAC 1680 
ACCTCGTCCC CTTCAAACAG AACCAGGGAG TTCTCGTCCG GGCTGAAGGG GGCGTAGCCT 1740 
CTCATCTCGC CAAGTGGCAC CACAGTGCCA TTCACCAGGT TCCAGCAGCT GGGGTGCCGG 1800 
GCGTTGGTGC CACAGG CCAG CAGCCCCTCA CTCCGCCTCT CCAGGAGAGT GATGTAGTTC 1B60 
TCGCAGTCCC GCTTAT CCAG ACAGGACCCC TTTGTGGAGC CGATATTCAC CGTGCGCACA 1920 
GATGCGTTCT TGCCCTCGGG GAAGTCAAAG AGGTAGACCT TGCCACGTCC TCCCACCCAC 1980 
ACAGAGGAGC TGCCTGGCTC GTGGAAAAGC ACCGTGTGCG GCT CAGTCTG GCCAAAGTCC 2040 
ACCCGGTCCT GCC CTACATG GCCTTTCCAG ACGGCGAAGA TGCGGGGTCC GCTCCTTAGG 2100 
TGGCCCTGGG CGGAGGCGGC GGCCGCCCAG AG C AG CAG CA GCAGCCGCAG CCGCAGCGGA 2160 
AGCCCCAACC GAGCCGGCGG GCCAGGGACG CGGGCGCGCG GTGCGCTGGG GGCGGCACGT 2220 
CCGGGCGGAG GAGGCGTCAT CCCAAGCCGA ATT C TGCAGA TATCCATCAC ACTGGCGGCC 2280 
GCTCGAGCAT GCATCTAGAG GGCCCAATTC GCCCTATAGT GAGTCGTATT ACAATTCACT 2340 
GGCCGTCGTT TTACAACGTC GTGACTGGGA AAACCCTGGC GTTACCCAAC TTAATCGCCT 2400 
TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA CCGATCGCCC 2 460 
TTCC CAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG CCCTGTAGCG GCGCATTAAG 2520 
CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT GACCGCTACA CTTGCCAGCG CCCTAGCGCC 2580 
CGCTCCTTTC GCTTTCTTCC CTTCCTTTCT CGCCACGTTC GCCGGCTTTC CCCGTCAAGC 2640 
TCTAAATCGG GGGCTCCCTT TAGGGTTCCG ATTTAGAGCT TTACGGCACC TCGACCGCAA 2700 
AAAACTTGAT TTGGGTGATG GTTCACGTAG TGGGCCATCG CCCTGATAGA CGGTTTTTCG 2760 
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10 



20 



CCCTTTGACG TTGGAGTCCA CGTTCTTTAA TAGTGGACTC TTGTTCCAAA CTGGAACAAC 
ACTCAACCCT ATCGCGGTCT ATTCTTTTGA TTTATAAGGG ATTTTGCCGA TTTCGGCCTA 
TTGGTTAAAA AATGAGCTGA TTTAACAAAT TCAGGGCGCA AGGGCTGCTA AAGGAACCGG 
AACACGTAGA AAGCCAGTCC GCAGAAACGG TGCTGACCCC GGATGAATGT CAGCTACTGG 
G CTATCTGGA CAAGGGAAAA CGCAAGCGCA AAGAGAAAGC AGGTAGCTTG CAGTGOGCTT 
ACATGGCGAT AGCTAGACTG GGCGGTTTTA TGGACAGCAA G CG AACCGGA ATTGCCAGCT 
GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC TGCAAAGTAA ACTOGATGOC TTTCTTGCCG 
CCAAGGATCT GATGGCGCAG GGGATCAAGA T CTGATCAAG AGACAGGATG AGGATCGTTT 
CGCATGATTG AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA 
TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT GTTCCGGCTG 
TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC TGTCCGGTGC CCTGAATGAA 
CTGCAGGACG AGGCAGCGCG GCTATCGTGG CTGGCCACGA CGGGCGTTCC TTGCGCAGCT 
GTGCTCGACG TTGTCACTGA AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG 
CAGGATCTCC TGTCATCTCG CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA 
ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA AGCGAAACAT 
CGCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG TCGATCAGGA TGATCTGGAC 
GAAGAGCATC AGGGGCTCGC GCCAGCCGAA CTGTTCGCCA GG CTCAAGGC GCGCATGCCC 
GACGGCGAGG ATCTCGTCGT GATCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA 
AATGGCCGCT TTTCTGGATT CAACGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG 
GACATAGCGT TGGATACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG GGCTGACCGC 
TTCCTCGTGC TTTACGGTAT CGCCGCTCCC GATTCGCAGC G CATCGCCTT CTATCGCCTT 
CTTGACGAGT TCTTCTGAAT TGAAAAAGGA AGAGTATGAG TATTCAACAT TTCCGTGTCG 
CCCTTATTCC CTTTTTTGCG GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG 
TGAAAGTAAA AGATGCTGAA GATCAGTTGG GTGCACGAGT GGGTTACATC GAACTGGATC 
TCAACAGCGG TAAG AT C CTT GAGAGTTTTC GCCCCGAAGA ACGTTTTCCA ATGATGAGCA 
CTTTTAAAGT TCTGCTATGT CATACACTAT TATCCCGTAT TGACGCCGGG CAAGAGCAAC 
TCGGTCGCCG GGCGCGGTAT TCTCAGAATG ACTTGGTTGA GTACTCACCA GTCACAGAAA 
AG CAT CTTAC GGATGGCATG ACAGTAAGAG AATTATGCAG TGCTGCCATA ACCATGAGTG 



2620 
2660 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
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4320 
4360 
4440 
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5 



10 



15 



20 



25 



30 



35 



40 



45 



ATAACACTGC GG CCAACTTA CTTCTGACAA 
ttttgcacaa CATGGGGGAT CATGTAACTC 
AAGCCATACC AAACGACGAG AGTGACACCA 
GCAAACTATT AACTGGCGAA CTACTTACTC 
TGGAGGCGGA TAAAGTTGCA GGACCACTTC 
TTGCTGATAA ATCTGGAGC C GGTGAGCGTG 
CAGATGGTAA GCCCTCCCGT ATCGTAGTTA 
ATGAACGAAA TAGACAGATC G CTGAGATAG 
CAGAC CAAGT TTACTCATAT ATACTTTAGA 
GGATCTAGGT GAAGATCCTT TTTGATAATC 
CGTTCCACTG AGCGTCAGAC CCCGTAGAAA 
TTCTGCGCGT AATCTGCTGC TTGCAAACAA 
TGCCGGATCA AGAGCTACCA ACTCTTTTTC 
TACCAAATAC TGTCCTTCTA GTGTAGCCGT 
CACCGCCTAC ATACCTCGCT CTGCTAATCC 
AGTCGTGTCT TACCGGGTTG GACTCAAGAC 
GCTGAACGGG GGGTTCGTGC ACACAGCCCA 
GATACCTACA GCGTGAGCAT TGAGAAAGCG 
GGTATCCGGT AAGCGGCAGG GTCGGAACAG 
ACGCCTGGTA TCTTTATAGT CCTGTCGGGT 
TGTGATGCTC GTCAGGGGGG CGGAGCCTAT 
GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC 
CTGTGGATAA C CGTATTACC GCCTTTGAGT 
CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG 



CGATCGGAGG ACCGAAGGAG CTAACCGCTT 
GCCTTGATCG TTGGGAACCG GAGCTGAATG 
CGATGCCTGT AGCAATGCCA ACAACGTTGC 
TAGCTTCCCG GCAACAATTA ATAGACTGGA 
TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA 
GGTCTCGCGG TATCATTGCA GCACTGGGGC 
TCTACACGAC GGGGAGTCAG GCAACTATGG 
GTGCCTCACT GATTAAGCAT TGGTAACTGT 
TTGATTTAAA ACTTCATTTT TAATTTAAAA 
TCATGACCAA AATC CCTTAA CGTGAGTTTT 
AGATCAAAGG ATCTTCTTGA GATCCTTTTT 
AAAAACCACC GCTACCAGCG GTGGTTTGTT 
CGAAGGTAAC TGGCTTCAGC AGAGCGCAGA 
AGTTAGGCCA CCACTTCAAG AACTCTGTAG 
TGTTACCAGT GGCTGCTGCC AGTGGCGATA 
GATAGTTACC GGATAAGGCG CAGCGGTCGG 
GCTTGGAGCG AACGACCTAC ACCGAACTGA 
CCACGCTTCC CGAAGGGAGA AAGGCGGACA 
GAGAGCGCAC G AGGGAG CTT CCAGGGGGAA 
TTCGCCACCT CTGACTTGAG CGTCGA TT TT 
GGAAAAACGC CAGCAACGCG GCCTTTTTAC 
ACATGTTCTT TCCTGCGTTA TCCCCTGATT 
GAGCTGATAC CGCTCGCCGC AGCCGAACGA 
CGGAAG 



4500 

4560 

4620 

4660 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 

5700 

5760 

5820 

5856 



(2) INFORMATION ZU SEQ ID NO: 35: 

(i) SEQUENZ CHARACTER I STIKA: 

(A) LANGE: 7475 Basenpaare 

(B) ART: Nukleinsaure 
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(C) STRANGFORM: Einzel 

(D) TOPOLOGIE : linear 

(ii) ART DES MODEKtoS : DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSBL: exon 

(B) IiAGE : 1..7475 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO : 35: 



GACGGATCGG 


GAGATCTCCC 


GATCCCCTAT 


GGTCGACTCT 


CAGTACAATC 


TGCTCTGATG 


60 


CCGCATAGTT 


AAGCCAGTAT 


CTGCTCCCTG 


CTTGTGTGTT 


GGAGGTCGCT 


GAGTAGTGCG 


120 


CGAGCAAAAT 


TTAAGCTACA 


ACAAGGCAAG 


GCTTGACCGA 


CAATTGCATG 


AAGAATCTGC 


180 


TTAGGGTTAG 


GCGTTTTGCG 


CTGCTTCGCG 


ATGTACGGGC 


CAGATATACG 


CGTTGACATT 


240 


GATTATTGAC 


TAGTTTATTAA 


TAGTAATCAA 


TTACGGGGTC 


ATTAGTTCAT 


AGCCCATATA 


300 


TGGAGTTCCG 


CGTTACATAA 


CTTACGGTAA 


ATGGCCCGCC 


TGGCTGACCG 


CCCAACGACC 


360 


CCCGCCCATT 


GACGTCAATA 


ATGACGTATG 


TTCCCATAGT 


AACGCCAATA 


GGGACTTTCC 


420 


ATTGACGTCA 


ATGGGTGGAC 


TATTTACGGT 


AAACTGCCCA 


CTTGGCAGTA 


CATCAAGTGT 


480 


ATC ATATGC C 


AAGTACGCCC 


CCTATTGACG 


TCAATGACGG 


TAAATGGCCC 


GCCTGGCATT 


540 


ATGCC CAGTA 


CATGACCTTA 


TGGGACTTTC 


CTACTTGGCA 


GTACATCTAC 


GTATTAGTCA 


600 


TCGCTATTAC 


CATGGTGATG 


CGGTTTTGGC 


AGTACATCAA TGGGCGTGGA 


TAGCGGTTTG 


660 


ACTCACGGGG 


ATTTCCAAGT 


CTCCACCCCA 


TTGACGTCAA 


TGGGAGTTTG 


TTTTGGCACC 


720 


AAAATCAACG 


GGACTTTCCA 


AAATGTCGTA 


ACAACTC CGC 


CCCATTGACG 


CAAATGGGCG 


780 


GTAGGCGTGT 


ACGGTGGGAG 


GTCTATATAA 


GCAGAGCTCT 


CTGGCTAACT 


AGAGAACCCA 


840 


CTG CTTACTG 


GCTTATCGAA 


ATTAATACGA 


CTCACTATAG 


GGAGACCCAA 


GCTGGCTAGC 


900 


GTTTAAACGG 


GCCCTCTAGA 


CT CGAGCGGC 


CGCCACTGTG 


CTGGATATCT 


GCAGAATTCG 


960 


GCTTGGGATG 


ACGCCTCCTC 


CGCCCGGACG 


TGCCGCCCCC 


AGCGCACCGC 


GCGCCCGCGT 


1020 


CCCTGGCCCG 


CCGGCTCGGT 


TGGGGCTTCC 


GCTGCGGCTG 


CGGCTGCTGC 


TGCTGCTCTG 


1080 


GGCGGCCGCC 


GCCTCCGCCC 


AGGGC CACCT 


AAGGAGCGGA 


CCCCGCATCT 


TCGCCGTCTG 


1140 


GAAAGGCCAT 


GTAGGGCAGG 


ACCGGGTGGA 


CTTTGGCCAG 


ACTGAGCCGC 


ACACGGTGCT 


1200 


TTTCCACGAG 


CCAGGCAGCT 


cctctgtgtg 


GGTGGGAGGA 


CGTGGCAAGG 


TCTACCTCTT 


1260 
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TGACTTCCCC GAGGGCAAGA ACGCATCTGT GCGCACGGTG AATATCGGCT CCACAAAGGG 132 0 
GTCCTGTCTG GATAAGCGGG ACTGCGAGAA CTACATCACT CTCCTGGAGA GGCGGAGTGA 1380 
GGGGCTGCTG GCCTGTGGCA CCAACGCCC G GCACCCCAGC TGCTGGAACC TGGTGAATGG 1440 
CACTGTGGTG CCACTTGGCG AGATGAGAGG CTACGCCCCC TTCAGCCCGG ACGAGAACTC 1500 
CCTGGTTCTG TTTGAAGGGG ACGAGGTGTA TTCCACCATC CGGAAGCAGG AATACAATGG 1560 
GAAGATCCCT CGGTTCCGCC GCATC CGGGG CGAGAGTGAG CTGTACACCA GTGATACTGT 1620 
CATGCAGAAC CCACAGTTCA TCAAAGCCAC CATCGTGGAC CAAGACCAGG CTTACGATGA 1680 
CAAGATCTAC TACTTCTTCC GAGAGGACAA TCCTGACAAG AATCCTGAGG CTCCTCTCAA 1740 
TGTGTCCCGT GTGGCCCAGT TGTGCAGGGG GGACCAGGGT GGGGAAAGTT CACTGTCAGT 1800 
CTCCAAGTGG AACACTTTTC TGAAAGCCAT GCTGGTATGC AGTGATGCTG CCACCAACAA 1860 
GAACTTCAAC AGGCTGCAAG ACGTCTTCCT GCTCCCTGAC CCCAGCGGCC AGTGGAGGGA 192 0 
CACCAGGGTC TATGGTGTTT TCTCCAACCC CTGGAACTAC TCAGCCGTCT GTGTGTATTC 1980 
CCTCGGTGAC ATTGACAAGG TCTTCCGTAC CTCCTCACTC AAGGGCTACC ACTCAAGCCT 2040 
TCCCAACCCG CGGCCTGGCA AGTGCCTCCC AGACCAGCAG CCGATACCCA CAGAGACCTT 2100 
CCAGGTGGCT GACCGTCACC CAGAGGTGGC GCAGAGGGTG GAGCCCATGG GGCCTCTGAA 2160 
GACGCCATTG TTCCACTCTA AATACCACTA CCAGAAAGTG GCCGTTCACC G CATGCAAGC 2220 
CAGCCACGGG GAGACCTTTC ATGTGCTTTA CCTAACTACA GACAGGGGCA CTATCCACAA 2280 
GGTGGTGGAA CCGGGGGAGC AGGAGCACAG CTTCGCCTTC AACATCATGG AGATCCAGCC 2340 
CTTCCGCCGC GCGGCTGCCA TCCAGACCAT GTCGCTGGAT GCTGAGCGGA GGAAGCTGTA 2400 
TGTGAGCTCC CAGTGGGAGG TGAGCCAGGT GCCCCTGGAC CTGTGTGAGG TCTATGGOGG 2460 
GGGCTGCCAC GGTTGCCTCA TGTCCCGAGA CCCCTACTGC GGCTGGGACC AGGGCCGCTG 2520 
CATCTCCATC TACAGCTCCG AACGGTCAGT GCTGCAATCC ATTAATCCAG CCGAGCCACA 2580 
CAAGGAGTGT CCCAACCCCA AACCAGACAA GGCCCCACTG CAGAAGGTTT CCCTGGCCCC 2640 
AAACTCTCGC TACTACCTGA GCTGCCCCAT GGAATCCCGC CACGCCACCT ACTCATGGCG 2700 
CCACAAGGAG AACGTGGAGC AGAGCTGCGA ACCTGGTCAC CAGAGCCCCA ACTGCATCCT 2760 
GTTCATCGAG AACCTCACGG CGCAGCAGTA CGGCCACTAC TTCTGCGAGG CCCAGGAGGG 2820 
CTCCTACTTC CGCGAGGCTC AGCACTGGCA GCTGCTGCCC GAGGACGGCA TCATGGCCGA 2880 
GCACCTGCTG GGTCATGCCT GTGCCCTGGC TGCCTCCCTC TGGCTGGGGG TGCTGCCCAC 2940 
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ACTCACTCTT 


GGCTTGCTGG 


TCCACGTGAA 


GCTTGGGCCC 


GAACAAAAAC 


TCATCTCAGA 


3000 




AGAGGATCTG 


AATAGCGCCG 


TCGACCATCA 


TCATCATCAT 


CATTGAGTTT 


AAACCGCTGA 


3060 


5 


TCAGCCTCGA 


CTGTGCCTTC 


TAGTTGCCAG 


CCATCTGTTG 


TTTGCCCCTC 


CCCCGTGCCT 


3120 




TCCTTGACCC 


TGGAAGGTGC 


CACTCCCACT 


GTCCTTTCCT 


AATAAAATGA 


GGAAATTGCA 


3180 


10 


TCGCATTGTC 


TGAGTAGGTG 


TCATTCTATT 


CTGGGGGGTG 


GGGTGGGGCA 


GGACAGCAAG 


3240 




GGGGAGGATT 


GGGAAGACAA 


TAG CAGG CAT 


GCTGGGGATG 


CGGTGGGCTC 


TATGGCTTCT 


3300 




GAGGCGGAAA 


GAACCAGCTG 


GGGCTCTAGG 


GGGTATCCCC 


ACGCGCCCTG 


TAGCGGCGCA 


3360 


15 


TTAAGCGCGG 


CGGGTGTGGT 


GGTTACGCGC 


AGCGTGACCG 


CTACACTTGC 


CAGCGCCCTA 


3420 




GCGCCCGCTC 


CTTTCGCTTT 


CTTCCCTTCC 


TTTCTCGCCA 


CGTTCGCCGG 


CTTTCCCCGT 


3480 


20 


CAAGCTCTAA 


ATCGGGGCAT 


CCCTTTAGGG 


TTCCGATTTA 


GTGCTTTACG 


GCACCTCGAC 


3540 


CCCAAAAAAC 


TTGATTAGGG 


TGATGGTTCA 


CGTAGTGGGC 


CATCGCCCTG 


ATAGACGGTT 


3600 




TTTCGCCCTT 


TGACGTTGGA 


GTCCACGTTC 


TTTAATAGTG 


GACTCTTGTT 


CCAAACTGGA 


3660 


25 


ACAACACTCA 


ACCCTATCTC 


GGTCTATTCT 


TTTGATTTAT 


AAGGGATTTT 


GGGGATTTCG 


3720 




GCCTATTGGT 


TAAAAAATGA 


GCTGATTTAA 


CAAAAATTTA 


ACGCGAATTA 


ATTCTGTGGA 


3780 


30 


ATGTGTGTCA 


GTTAGGGTGT 


GGAAAGTCCC 


CAGGCTCCCC 


AGGCAGGCAG 


AAGTATGCAA 


3640 


AGCATGCATC 


TCAATTAGTC 


AGCAACCAGG 


TGTGGAAAGT 


CCCCAGGCTC 


CCCAGCAGGC 


3900 




AGAAGTATGC 


AAAGCATG CA 


TCTCAATTAG 


TCAGCAACCA 


TAGTCCCGCC 


CCTAACTCCG 


3960 


35 


CCCATCCCGC 


CCCTAACTCC 


GCCCAGTTCC 


GCCCATTCTC 


CGCCCCATGG 


CTGACTAATT 


4020 




TTTTTTATTT 


ATGCAGA GGC 


CGAGGCCGCC 


TCTGCCTCTG 


AG CT ATT C CA 


GAAGTAGTGA 


4080 




GGAGGCTTTT 


TTGGAGGCCT 


AGGCTTTTGC 


AAAAAGCTCC 


CGGGAGCTTG 


TATATCCATT 


4140 


40 


TTCGGATCTG 


ATCAAGAGAC 


AGGATGAGGA 


TCGTTTCGCA 


TGATTGAACA 


AGATGGATTG 


4200 




CACGCAGGTT 


CTCCGGCCGC 


TTGGGTGGAG 


AGGCTATTCG 


GCTATGACTG 


GGCACAACAG 


4260 


45 


ACAATCGGCT 


GCTCTGATGC 


CGCCGTGTTC 


CGGCTGTCAG 


CGCAGGGGCG 


CCCGGTTCTT 


4320 


tttgtcaaga 


CCGACCTGTC 


CGGTGCCCTG 


AATGAACTGC 


AGGACGAGGC 


AGCGCGGCTA 


4380 




TCGTGGCTGG 


C CACX3 ACGGG 


CGTTC CTTGC 


GCAGCTGTGC 


TCGACGTTGT 


CACTGAAGCG 


4440 


50 


GGAAGGGACT 


GGCTGCTATT 


GGGCGAAGTG 


CCGGGGCAGG 


ATCTCCTGTC 


ATCTCACCTT 


4500 




GCTCCTGCCG 


AGAAAGTATC 


CATCATGGCT 


GATGCAATGC 


GGCGGCTGGA 


TACGCTTGAT 


4560 
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50 



CCGGCTACCT 


GCCCATTCGA 


CCACCAAGCG 


AAACATCGCA 


TCGAGCGAGC 


ACGTACTCGG 


4620 


ATGGAAGCCG 


GTCTTGTCGA 


TCAGGATGAT 


CTGGACGAAG 


AGCATCAGGG 


GCTCGCGC CA 


4680 


GCCGAACTGT 


TCGCCAGGCT 


CAAGGCGCGC 


ATGCCCGACG 


GCGAGGATCT 


CGTCGTGACC 


4740 


CATGGCGATG 


CCTGCTTGCC 


GAATATCATG 


GTGGAAAATG 


GCCGCTTTTC 


TGGATTCATC 


4800 


GACTGTGGCC 


GGCTGGGTGT 


GGCGGACCGC 


TATCAGGACA 


TAGCGTTGGC 


TACCOGTGAT 


4860 


ATTG CTGAAG 


AGCTTGGCGG 


CGAATGGGCT 


GACCGCTTCC 


TCGTGCTTTA 


CGGTATCGCC 


4920 


GCTCCCGATT 


CGCAGCGCAT 


CGCCTTCTAT 


CGCCTTCTTG 


ACGAGTTCTT 


CTGAGCGGGA 


4980 


CTCTGGGGTT 


CGAAATGACC 


GACCAAGCGA 


CGCCCAACCT 


GCCATCACGA 


GATTTCGATT 


5040 


CCACCGCCGC 


CTTCTATGAA 


AGGTTGGGCT 


TCGGAATCGT 


TTTCCGGGAC 


GCCGGCTGGA 


5X00 


TGATCCTCCA 


GCGCGGGGAT 


CTCATGCTGG 


AGTTCTTCGC 


CCACCCCAAC 


TTGTTTATTG 


5160 


CAGCTTATAA 


TGGTTACAAA 


TAAAGCAATA 


GCATCACAAA 


TTTCACAAAT 


AAAGCATTTT 


5220 


TTTCACTGCA 


TTCTAGTTGT 


GGTTTGTCCA 


AACTCATCAA 


TGTATCTTAT 


CATGTCTGTA 


5280 


TACCGTCGAC 


CTCTAGCTAG 


AGCTTGGCGT 


AATCATGGTC 


ATAGCTGTTT 


CCTGTGTGAA 


5340 


ATTGTTATCC 


GCTCACAATT 


CCACACAACA 


TACGAGCCGG 


AAGCATAAAG 


TGTAAAGCCT 


5400 


GGGGTGCCTA 


ATGAGTGAGC 


TAACTCACAT 


TAATTGCGTT 


GCGCTCACTG 


CCCGCTTTCC 


5460 


AGTCGGGAAA 


CCTGTCGTGC 


CAGCTGCATT 


AATGAATCGG 


CCAACGCGCG 


GGGAGAGGCG 


5520 


GTTTGCGTAT 


TGGGCGCTCT 


TCCGCTTCCT 


CGCTCACTGA 


CTCGCTGCGC 


TCGGTCGTTC 


5580 


GGCTGCGGCG 


AGCGGTATCA 


GCTCACTCAA 


AGGCGGTAAT 


ACGGTTATCC 


ACAGAATCAG 


5640 


GGGATAACGC 


AGGAAAGAAC 


ATGTGAGCAA 


AAGGCCAGCA 


AAAGGCCAGG 


AACCGTAAAA 


5700 


AGGCCGCGTT 


GCTGGCGTTT 


TTCCATAGGC 


TCCGCCCCCC 


TG ACGAG CAT 


CACAAAAATC 


5760 


GACGCTCAAG 


TCAGAGGTGG 


CGAAACCCGA 


CAGGACTATA 


AAGATACCAG 


GCGTTTCCCC 


5820 


CTGGAAG CTC 


CCTCGTGCGC 


TCTCCTGTTC 


CGACCCTGCC 


GCTTACCGGA 


TACCTGTCCG 


5880 


CCTTTCTCCC 


TTCGGGAAGC 


GTGGCGCTTT 


CTCAATGCTC 


ACGCTGTAGG 


TATCTCAGTT 


5940 


CGGTGTAGGT 


CGTTCGCTCC 


AAGCTGGGCT 


GTGTGCACGA 


ACCCCCCGTT 


CAGCCCGACC 


6000 


GCTGCGCCTT 


ATCCGGTAAC 


TATCGTCTTG 


AGTCCAA CCC 


GGTAAGACAC 


GACTTATCGC 


6060 


CACTGGCAGC 


AGCCACTGGT 


AACAGGATTA 


GCAGAGCGAG 


GTATGTAGGC 


GGTGCTACAG 


6120 


AGTTCTTGAA 


GTGGTGGCCT 


AACTACGGCT 


ACACTAGAAG 


GACAGTATTT 


GGTATCTGCG 


6180 


CTCTGCTGAA 


GCCAGTTACC 


TTCGGAAAAA 


GAGTTGGTAG 


CTCTTGATCC 


GGGAAACAAA 


6240 
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CCACCGCTGG TAGCGGTGGT TTTTTTGTTT GCAAGCAG C A GATTACGCGC AGAAAAAAAG 
GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG AACGAAAACT 
CACGTTAAGG GATTTTGGTC ATGAGATTAT CAAAAAGGAT CTTCACCTAG ATCCTTTTAA 
ATTAAAAATG AAGTTTTAAA TCAATCTAAA GTATATATGA GTAAACTTGG TCTGACAGTT 
ACCAATGCTT AATCAGTGAG G CACCTATCT CAGCGATCTG TCTATTTCGT TCAT C CATAG 
TTGCCTGACT CCCCGTCGTG TAGATAACTA CGATACGGGA GGGCTTACCA TCTGGCCCCA 
GTGCTGCAAT GATACCGCGA GACCCACGCT CACCGGCTCC AGATTTATCA GCAATAAACC 
AGC CAGCCGG AAGGGCCGAG CG CAGAAGTG GTCCTGCAAC TTTATCCGCC TCCATCCAGT 
CTATTAATTG TTGCCGGGAA GCTAQAGTAA GTAGTTCGCC AGTTAATAGT TTGCGCAACG 
TTGTTGCCAT TGCTACAGGC ATCGTGGTGT CACGCTCGTC GTTTGGTATG GCTTCATTCA 
GCTCCGGTTC CCAACGATCA AGGCGAGTTA CATGATCCCC CATGTTGTGC AAAAAAGCGG 
TTAGCTCCTT CGGTCCTCCG ATCGTTGTCA GAAGTAAGTT GGCCGCAGTG TTATCACTCA 
TGGTTATGG C AGCACTGCAT AATTCTCTTA CTGTCATGCC ATCCGTAAGA TGCTTTTCTG 
TGACTGGTGA GTACTCAACC AAGTCATTCT GAGAATAGTG TATGCGGCGA CCGAGTTGCT 
CTTGCCCGGC GTCAATACGG GATAATACCG CGCCACATAG CAGAACTTTA AAAGTGCTCA 
TCATTGGAAA ACGTTCTTCG GGGCGAAAAC T CTCAAGG AT CTTACCGCTG TTGAGATCCA 
GTTCGATGTA ACCCACTCGT GCACCCAACT GATCTTCAGC AT CTTTT ACT TTCACCAGCG 
TTTCTGGGTG AGCAAAAACA GGAAGGCAAA ATGCCGCAAA AAAGGGAATA AGGGGGACAC 
GGAAATGTTG AATACTCATA CTCTTCCTTT TT CAAT ATT A TTG AAG C ATT TATCAGGGTT 
ATTGTCTCAT GAGCGGATAC ATATTTGAAT GTATTTAGAA AAATAAACAA ATAGGGGTTC 
CGCGCACATT TCCCCGAAAA GTGCCACCTG ACGTC 



(2) INFORMATION ZU SBQ ID NO: 36: 

(i) SEQUENZ CHARAKTERISTIKA : 

(A) LANGE: 8192 Basenpaare 

(B) ART: Nukleins&ure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 



( ii ) ART DES MOLEKULS: DNS (genomisch) 
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(ix) MERKMALE: 

(A) NAME / SCHLOSSEL : exon 

(B) LAGS: 1..8192 

(xi) SEQUBNZBESCHREIBUNG: SEQ ID NO: 36: 

GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC TGCTCTGATG 60 

CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT GGAGGTCGCT GAGTAGTGCG 120 

CGAGCAAAAT TTAAGCTACA ACAAGGCAAG GCTTGACCGA CAATTGCATG AAGAATCTGC 

TTAGGGTTAG GCGTTTTGCG CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT 240 

GATTATTGAC TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA 300 

TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG CCCAACGACC 360 

CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT AACGCCAATA GGGACTTTCC 420 

ATTGACGTCA ATGGGTGGAC TATTTACGGT AAACTGCCCA CTTGGCAGTA CATCAAGTGT 480 

ATCATATGCC AAGTACGCCC CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT 540 

ATGCCCAGTA CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 600 

TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA TAGCGGTTTG 660 

ACTCACGGGG ATTTCCAAGT ctccacccca TTGACGTCAA TGGGAGTTTG TTTTGGCACC 720 

AAAATCAACG GGACTTTCCA AAATGTCGTA ACAACTCCGC CCCATTGACG CAAATGGGCG 780 

gtaggcgtgt acggtgggag gtctatataa GCAGAGCTCT CTGGCTAACT AGAGAACCCA 840 

CTGCTTACTG GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 900 

gtttaaacgg gccctctaga ctcgagcggc cgccactgtg ctggatatct gcagaattcg 960 

GCTTGGGATG ACGCCTCCTC CGCCCGGACG TGCCGCCCCC AGCGCACCGC GCGCCCGCGT 1020 

CCCTGGCCCG CCGGCTCGGT TGGGGCTTCC GCTGCGGCTG CGGCTGCTGC TGCTGCTCTG 1080 

GGCGGCCGCC GCCTCCGCCC AGGGCCACCT AAGGAGCGGA CCCCGCATCT TCGCCGTCTG 1140 

GAAAGGCCAT GTAGGGCAGG ACCGGGTGGA CTTTGGCCAG ACTGAGCCGC ACACGGTGCT 1200 

TTTCCACGAG ccaggcagct cctctgtgtg ggtgggagga CGTGGCAAGG TCTACCTCTT 1260 

TGACTTCCCC GAGGGCAAGA ACGCATCTGT GCGCACGGTG AATATCGGCT CCACAAAGGG 1320 

GTCCTGTCTG GATAAGCGGG ACTGCGAGAA CTACATCACT CTCCTGGAGA GGCGGAGTGA 1380 

GGGGCTGCTG GCCTGTGG C A CCAACGCCCG GCACCCCAGC TGCTGGAACC TGGTGAATGG 1440 
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CACTGTGGTG CCACTTGGCG AGATGAGAGG 
CCTGGTTCTG TTTGAAGGGG ACGAGGTGTA 
GAAGATCCCT CGGTTCCGCC GCATCCG GGG 
CATGCAGAAC CCACAGTTCA TCAAAGCCAC 
CAAGATCTAC TACTTCTTCC GAGAGGACAA 
TGTGTCCCGT GTGGCCCAGT TGTGCAGGGG 
CTCCAAGTGG AACACTTTTC TGAAAGCCAT 
QAACTTCAAC AGGCTG CAAG ACGTCTTCCT 
CACCAGGGTC TATGGTGTTT TCTCCAACCC 
CCTCGGTGAC ATTGACAAGG TCTTCCGTAC 
TCCCAACCCG CQGCCTGGCA AGTGCCTCCC 
CCAGGTGGCT GACCGTCACC CAGAGGTGGC 
GACGCCATTG TTCCACTCTA AATAC CACTA 
CAGCCACGGG GAGACCTTTC ATGTGCTTTA 
GGTGGTGGAA CCGGGGGAGC AGGAGCACAG 
CTTCCGCCGC GCGGCTGCCA TCCAGACCAT 
TGTGAGCTCC CAGTGGGAGG TGAGCCAGGT 
GGGCTGCCAC GGTTGCCTCA TGTCCCGAGA 
CATCTCCATC TACAGCTCCG AACGGTCAGT 
CAAGGAGTGT CCCAACCCCA AACCAGACAA 
AAACTCTCGC TACTACCTGA GCTGCCCCAT 
CCACAAGGAG AACGTGGAGC AGAGCTGCGA 
GTTCATCGAG AACCTCACGG CGCAGCAGTA 
CTCCTACTTC CGCGAGGCTC AG CACTGGCA 
GCACCTGCTG GGTCATGC CT GTGCCCTGGC 
ACTCACT CTT GGCTTGCTGG TCCACATGGT 
GGTGCCCATC CTGGTCGAGC TGGACGGCGA 
CGAGGGC GAG GGCGATGCCA CCTACGGCAA 



CTACGCCCCC TTCAGCCCGG ACGAGAACTC 
TTCCACCATC CGGAAGCAGG AATACAATGG 
CGAGAGTGAG CTGTACACCA GTGATACTGT 
CATCGTGCAC CAAGACCAGG CTTACGATGA 
TCCTGACAAG AATCCTGAGG CTCCTCTCAA 
GGACCAGGGT GGGGAAAGTT CACTGTCAGT 
GCTGGTATGC AGTGATGCTG CCACCAACAA 
GCTCCCTGAC CCCAGCGGCC AGTGGAGGGA 
CTGGAACTAC TCAGCCGTCT GTGTGT ATT C 
CTCCTCACTC AAGGGCTACC ACTCAAGCCT 
AGACCAGCAG CCGATACCCA CAGAGACCTT 
GCAGAGGGTG GAGCCCATGG GGCCTCTGAA 
CCAGAAAGTG GCCGTTCACC GCATGCAAGC 
CCTAACTACA GACAGGGGCA CTATCCACAA 
CTTCGCCTTC AACATCATGG AGATCCAGCC 
GTCGCTGGAT GCTGAGCGGA GGAAGCTGTA 
GCCCCTGGAC CTGTGTGAGG TCTATGGCGG 
CCCCTACTGC GGCTGGGACC AGGGC CGCTG 
GCTGCAATCC ATT AATC CAG CCGAGCCACA 
GGCCCCACTG CAGAAGGTTT CCCTGGCCCC 
GGAATCCCGC CACGCCACCT ACTCATGGCG 
ACCTGGTCAC CAGAGCCCCA ACTGCATCCT 
CGGCCACTAC TTCTGCGAGG CCCAGGAGGG 
GCTGCTGCCC GAGGACGGCA TCATGGCCGA 
TGCCTCCCTC TGGCTGGGGG TGCTGCCCAC 
GAGCAAGGGC GAGGAGCTGT TCACCGGGGT 
CGTAAACGGC CACAAGTTCA GCGTGTCCGG 
GCTGACCCTG AAGTTCATCT GCACCACCGG 



1500 

1560 

1620 

1660 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2860 

2940 

3000 

3060 

3120 
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CAAGCTGCCC GTGCCCTGGC CCACCCTCGT GACCACCCTG ACCTACGGCG TGCAGTGCTT 
CAGCCGCTAC CCCGACCACA TGAAGCAGCA CGACTTCTTC AAGTCCGCCA TGCCCGAAGG 
CTACGTCCAG GAG CG C AC CA TCTTCTTCAA GGACGACGGC AACTACAAGA CCCGCGCCGA 
GGTGAAGTTC GAGGGCGACA CC CTGGTGAA CCGCATCGAG CTGAAGGGCA TCGACTTGAA 
GGAGGACGGC AACATCCTGG GGCACAAGCT GGAGTACAAC TACAACAG C C ACAACGTCTA 
TATCATGGCC GACAAGCAGA AGAACGGCAT CAAGGTGAAC TTCAAGATCC GCCACAACAT 
CGAGGACGGC AGCGTGCAGC TCGCCGACCA CTACCAGCAG AACACCCCCA TCGGCGACGG 
CCCCGTGCTG CTGCCCGACA ACCACTACCT GAGCACCCAG TCCGCCCTGA GCAAAGACCC 
CAACGAGAAG CGCGATCACA TGGTCCTGCT GGAGTTCGTG ACCGCCGCCG GGATCACTCT 
CGGCATGGAC GAGCTGTACA AGGTGAAGCT TGGGCCCGAA CAAAAACTCA TCTCAGAAGA 
GGATCTGAAT AGCGCCGTCG ACCATCATCA T CAT CAT CAT TOAGTTTAAA CCGCTGATCA 
GCCTCGACTG TGC CTTCTAG TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC 
TTGACCCTGG AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG 
CATTGTCTGA GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TGGGG C AGG A CAGCAAGGGG 
GAGGATTGGG AAGACAATAG CAGGCATGCT GGGGATGCGG TGGGCTCTAT GGCTTCTGAG 
G CGGAAAGAA CCAGCTGGGG CTCTAGGGGG TATCCCCACG CGCCCTGTAG CGGCGCATTA 
AGCGCGGCGG GTGTGGTGGT TACGCGCAGC GTGACCGCTA CACTTGCCAG CGCCCTAGCG 
CCCGCTCCTT TCGCTTTCTT CCCTTCCTTT CTCGCCACGT TCGCCGGCTT TCCCCGTCAA 
GCTCTAAATC GGGGCATCCC TTTAGGGTTC CGATTTAGTG CTTTACGGCA CCTCGACCCC 
AAAAAACTTG ATTAGGGTGA TGGTTCACGT AGTGGGCCAT CGCCCTGATA GACGGTTTTT 
CGCCCTTTGA CGTTGGAGTC CACGTTCTTT AATAGTGGAC TCTTGTTCCA AACTGGAACA 
ACACTCAACC CTATCTCGGT CTATTCTTTT GATTTATAAG GGATTTTGGG GATTTCGGCC 
TATTGGTTAA AAAATGAGCT GATTTAACAA AAATTTAACG CGAATTAATT CTGTGGAATG 
TGTGTCAGTT AGGGTGTGGA AAGTCCCCAG GCTCCCCAGG CAGGCAGAAG TATGCAAAGC 
ATGCATCTCA ATTAGTCAGC AACCAGGTGT GGAAAGTCCC CAGGCTCCCC AGCAGGCAGA 
AGTATGCAAA GCATGCATCT CAATTAGTCA GCAACCATAG TCCCGCCCCT AACTCCGCCC 
ATCCCGCCCC TAACTCCGCC CAGTTCCGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT 
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tttatttatg cagaggccga ggccgcctct gcctctgagc tattccagaa gtagtgagga 

GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTCCCGG GAGCTTGTAT ATCCATTTTC 

1 ggatctgatc aagagacagg atgaggatcg tttcgcatga ttgaacaaga tggattgcac 

GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT ATGACTGGGC ACAACAGACA 
ATCGGCTGCT CTGATGCCGC CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT 

gtcaagaccg acctgtccgg tgccctgaat GAACTGCAGG acgaggcagc gcggctatcg 
tggctggcca cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac tgaagcggga 

r5 AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC TCCTGTCATC TCACCTTGCT 

CCTGCCGAGA AAGTATCCAT catggctgat GCAATGCGGC GGCTGCATAC gcttgatccg 
GCTACCTGCC CATTCGACCA C CAAGCG AAA CATCGCATCG AGCGAGCACG TACTCGGATG 
20 QAAGCCGGTC TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC 

GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT CGTGACCCAT 

ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg attcatcgac 

25 TGTGGCCGGC TGGGTGTGGC GGACCGCTAT CAGGACATAG CGTTGGCTAC CCGTGATATT 

gctgaagagc ttggcggcga atgggctgac CGCTTCCTCG TGCTTTACGG TATCGCCGCT 

CCCGATTCGC AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC 

30 

TGGGGTTCGA AATGACCGAC CAAGCG acgc ccaacctgcc atcacgagat ttcgattcca 
CCGCCGCCTT CTATGAAAGG TTGGGCTTCG GAATCGTTTT CCGGGACGCC GGCTGGATGA 
35 tcctccagcg cggggatctc ATGCTGGAGT TCTTCGCCCA CCCCAACTTG TTTATTGCAG 

CTTATAATGG TTACAAATAA AGCAATAGCA TCACAAATTT CACAAATAAA GCATTTTTTT 
CACTGCATTC TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT GTCTGTATAC 
40 CGTCGACCTC TAGCTAGAGC TTGGCGTAAT CATGGTCATA GCTGTTTCCT GTGTGAAATT 

GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG CATAAAGTGT AAAGCCTGGG 

gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc GCTTTCCAGT 

CGGGAAACCT GTCGTGCCAG CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGAGGCGGTT 
TGCGTATTGG GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG GTCGTTCGGC 
50 TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG GTTATCOACA GAATCAGGGG 

ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 
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gggcgttggt GGGcrmrG gatagggtcg gg=ggcc™a «« «»»T=a»c 
gctcaagtca gaggtgggga *™c**gg TTTCCCC ™ 

OjyyjCTCCCT GGXGGGGTG* GC^CGCA CCCTGCCGCT TACCGGAXAC C^TGGGCCT 

-rrcrcccTTC gcgaagggtg GGGcrrxGTG aaxgcg** 

tgtaggtcgt tgggtccaag cro«CTai» *ggagg«gc cggggttgag cccccccrr 

GCGCCTTATC GGGTAAGTAT ~K™«” “““““ 

„GCAGCAGC CACTGGIAAG K»TO»a GAGCGAGGTA 

XGXTGAAGTG GIGGCCTAAC TACGGGTAGA CTAQAAGAAC AGTATTTGGT .T^GCGCTC 
TGCTGAAQCC AGITACCTTC gg»a«g»g TOM0C ” <! 

gggc^tm gggxggttxx «»» »=»*«" ’ KGCoa “ 
ggcg^ xggtttcatg T-rr.GTAGGa gg*™cg= T®n»»c — 
gxtaaggga, t^gga™ agatxatgaa a^ggatgtt CAGGTAGAXG ex™.- 
^xGAAG .TC^T. T.™GAGTA 

AATGCTTAAT CGTGM^ GGXATGTGAG GGATG^GT «»>» 

GG^CXCCG gg^gxgtag ATAACTACGA TAGGGGAGGG ctxagcatct OGCCCC^G 
g^catgat accgcgagac gcacggtgag gggctccaga tttatgagga axaaacgagg 

G^cGGGAAG CGGGG^GOC AGAAGTGGTC =TG«AGTrr ATCCQCCTCC «—« 
XTAATGGTTG CCGGGAAOCT AGAGTAAGIA GTTCGCCAGT ®- GGC^XTG 

x.gggatigc tacaggcatc gtggtgtgac gccgxcgtt tggta^gcp tcatt^ct 
ggggxtggga aggatcaagg ggagttacat gatgccggat gtxgxggaaa aaaggggtta 

GCCGTXGGG TCGTCGOATG GTEGTCAGAA GTAAGITGGC CGGAGTGXX, TGACTGATGG 
TTATGGCAGC ACTGCATAAT TCTCTTACTG TCATGGCATC GGTAAOATGG TtTTCTGTGA 
GXGG^AGTA CICAACCAAG TCATTCIGAG AATAGTGTAT GCGGCGAGGG AGTTGCrCTT 
GCCCGGCGTC AATACGGGAT AATAGGGGGG GAGATAGGAG AACnTAAAA GKG^ATCA 
„GGAAAAG= TTCTTCGGGG CQAAAACTCT CAAGGAXGTT ACCGCIGTTG AGATGGAGTT 

ggaxgtaagg cagtcoigca cgcaactgat cttcagcatc ttxtagtttg aggaggg^ 

AAAAACGGA AGGCAAAATG GGGCAAAAAA GGGAATAAGG GGGAGAGOGA 
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aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat cagggttatt 

GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA G<3<3<3TTCCGC 
GCACATTTCC CCGAAAAGTG CCACCTGACG TC 

(2) INFORMATION ZU SEQ ID NO : 37: 

(i) SBQUENZ CHARAKTERISTIKA: 

(A) lAnGE: 7000 Basenpaare 

(B) ART: Nukleine&ure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS : DNS (genomisch) 

(ix) MERKMALE : 

(A) NAME/SCHLUSSEL: exon 

(B) IAGB: 1..7000 

(xi) SEQUENZBESCKREIBUNG: SEQ ID NO: 37: 

AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT TGTTCTCGTT 
AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC GATGGACAAG TGCATTGTTC 
TCTTGCTGAA AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC AGTACCCGGG 
AGTACCCTCG ACCGCCGGAG TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT 
TCAAACAAGC aaagtgaaca CGTCGCTAAG CGAAAGCTAA gcaaataaac aagcgcagct 
GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA AAAGTAACCA 
GCAACCAAGT aaatcaactg CAACTACTGA AATCTGCCAA GAAGTAATTA TTGAATACAA 
GAAGAGAACT CTGAATACTT TCAACAAGTT ACCGAGAAAG AAGAACTCAC ACACAGCTAG 
CGTTTAAACT TAAGCTTGGT ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGGAATTCGG 
CTTGGGATGA CGCCTCCTCC GCCCGGACGT GCCGCCCCCA GCGCACCGCG CGCCCGCGTC 
CCTGGCCCGC CGGCTCGGTT GGGGCTTCCG CTGCGGCTGC GGCTGCTGCT GCTGCTCTGG 
GCGGCCGCCG CCTCCGCCCA GGGCCACCTA AGGAGCGGAC CCCGCATCTT CGCCGTCTGG 
AAAGGCCATG TAGGGCAGGA CCGGGTGGAC TTTGGCCAGA CTGAGCCGCA CACGGTGCTT 
TTCCACGAGC CAGGCAGCTC CTCTGTGTGG GTGGGAGGAC GTGGCAAGGT CTACCTCTTT 
GACTTCCCCG AGGGCAAGAA CGCATCTGTG CGCACGGTGA ATATCGGCTC CACAAAGGGG 
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tcctgtctgg ataagcggga ctgcgagaac 
gggctgctgg cctgtggcac caacgcccgg 
actgtggtgc cacttggcga gatgagaggc 
ctggttctgt ttgaagggga cgaggtgtat 
aagatccctc ggttccgccg catccggggc 
atgcagaacc cacagttcat caaagccacc 
aagatctact acttcttccg agaggacaat 
gtgtcccgtg tggcccagtt gtgcaggggg 
tccaagtgga acacttttct gaaagccatg 
aacttcaaca ggctgcaaga cgtcttcctg 
accagggtct atggtotttt ctccaacccc 

CTCGGTGACA TTGACAAGGT CTTCCGTACC 
CCCAACCCGC GGCCTGGCAA GTGCCTCCCA 
CAGGTGGCTG ACCGTCACCC AGAGGTGGCG 

acgccattgt tccactctaa ataccactac 
agccacgggg agacctttca tgtgctttac 



tacatcactc tcctggagag gcggagtgag 
caccccagct GCTGGAACCT ggtgaatggc 
tacgccccct tcagcccgga cgagaactcc 

TCCACCATCC GGAAGCAGGA ATACAATGGG 
GAGAGTOAGC tgtacaccag tgatactgtc 
atcgtgcacc aagaccaggc ttacgatgac 

CCTGACAAGA ATCCTGAGGC TCCTCTCAAT 
GACCAGGGTG gggaaagttc ACTGTCAGTC 
CTGGTATGCA GTGATGCTGC CACCAACAAG 
CTCCCTGACC CCAGCGGCCA GTGGAGGGAC 
TGGAACTACT CAGCCGTCTG TGTGTATTCC 

tcctcactca agggctacca ctcaagcctt 
gaccagcagc cgatacccac agagaccttc 
cagagggtgg agcccatggg gcctctgaag 
cagaaagtgg ccgttcaccg catgcaagcc 

CTAACTACAG ACAGGGGCAC TATCCACAAG 



gtggtggaac cgggggagca ggagcacagc 
ttccgccgcg cggctgccat ccagaccatg 



ttcgccttca acatcatgga gatccagccc 
tcgctggatg ctgagcggag gaagctgtat 



gtgagctccc 

ggctgccacg 

atctccatct 

aaggagtgtc 

AACTCTCGCT 

cacaaggaga 

ttcatcgaga 

TCCTACTTC C 

n tv 



agtgggaggt 

gttgcctcat 

acagctccga 

CCAACCCCAA 

ACTACCTGAG 

acgtggagca 

acctcacggc 



gagccaggtg 

gtcccgagac 

acggtcagtg 

accagacaag 

CTGCCCCATG 

GAGCTGCGAA 

gcagcagtac 



CCCCTGGACC 

CCCTACTGCG 

CTGCAATCCA 

gccccactgc 

GAATCCCGCC 

CCTGGTCACC 

ggccactact 



tgtgtgaggt 

gctgggacca 

ttaatccagc 

agaaggtttc 

acgccaccta 

AGAGCCCCAA 

TCTGCGAGGC 



ctatggcggg 

gggccgctgc 

CGAGCCACAC 

CCTGGCCCCA 

CTCATGGCGC 

CTGCATCCTG 

CCAGGAGGGC 



gcgaggctca gcactggcag ctgctgcccg aggacggcat catggccgag 



nrpr* tv 



mnnr'r'Tnfir'T 



nnnTPrTTrT 






rm'nrmra 



CTCACTCTTG GCTTGCTGGT CCACGTGAAG 



CTTGGGCCCG TTTAAACCCG CTGATCAGCC 
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TCGACTQTGC CTTCTAGTTG CCAGCCATCT GTTGTTTGCC CCTCCCCCGT GCCTTCCTTG 

accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 
tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 
gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc ttctgaggcg 

GAAAGAACCA GCTGGGGCTC TAGGGGGTAT CCCCACGCGC CCTGTAGCGG CGCATTAAGC 

gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 

GCTCCTTTCG CTTTCTOCC TTCCTTTCTC GCCACGTTCG CCGGCTTTCC CCGTCAAGCT 
<5 CTAAATCGGG GCATCCCTTT AGGGTTCCGA TTTAGTGCTT TACGGCACCT CGACCCCAAA 

aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 

CCTTTGACGT TGGAGTCCAC GTT CTTTAAT AGTGGACTCT TGTTCCAAAC TGGAACAACA 
CTCAACCCTA TCTCGGTCTA TTCTTTTGAT TTATAAGGGA TTTTGGGGAT TTCGGCCIAT 

tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attaattctg tggaatgtgt 
2S gtcagttagg gtgtcgaaag tccccaggct ccccaggcag gcagaagtat gcaaagcatg 

CATCTCAATT AGTCAGCAAC CAGGTGTGGA AAGTCCCCAG GCTCCCCAGC AGGCAGAAGT 
ATGCAAAGCA TGCATCTCAA TTAGTCAGCA ACCATAGTCC CGCCCC1AAC TCCGCCCATC 
30 CCGCCCCTAA CTCCGCCCAG TTCCGCCCAT TCTCCGCCCC ATGGCTGACT AATTTTTTTT 

ATTTATGCAG AGGCCGAGGC CGCCTCTGCC TCTGAGCTAT TCCAGAAGTA GTGAGGAGGC 
35 TTTTTTGGAG GCCTAGGCTT TTGCAAAAAG CTCCCGGGAG CTTGTATATC CATTTTCGGA 

TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG AACAAGATGG ATTGCACGCA 
GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA TTCGGCTATG ACTGGGCACA ACAGACAATC 
40 GGCTGCTCTG ATGCCGCCGT GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC 

aagaccgacc TGTCCGGTGC cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg 

CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA AGCGGGAAGG 
GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC TGTCATCTCA CCTTGCTCCT 
GCCGAGAAAG TATCCATCAT GGCTGATGCA ATGCGGCGGC TGCATACGCT TGATCCGGCT 

ACC tgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 
gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 



/ 



2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 



93 




EP 0 892 047 A2 



CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT GACCCATGGC 
GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT TTTCTGGATT CATCGACTGT 
' GGCCGGCTGG GTGTGGCGGA ccgctatcag gacatagcgt tggctacccg tgatattgct 

GAAGAGCTTG GCGGCGAATG GGCTGACCGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC 
GATTCGCAGC GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAGC GGGACTCTGG 

ggttcgaaat gaccgaccaa gcgacgccca acctgccatc acgagatttc gattccaccg 

CCGCCTTCTA TGAAAGGTTG GGCTTCGGAA TCGTTTTCCG GGACGCCGGC TGGATGATCC 

1S TCCAGCGCGG ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt 

ATAATGGTTA CAAATAAAGC AATAGCATCA CAAATTTCAC AAATAAAGCA TTTTTTTCAC 
TGCATTCTAG TTGTGGTTTG TCCAAACTCA TCAATGTATC TTATCATGTC TGTATACCGT 
20 CGACCTCTAG CTAGAGCTTG GCGTAATCAT GGTCATAGCT GTTTCCTGTG TGAAATTGTT 

ATCCGCTCAC AATTCCACAC AACATACGAG CCGGAAGCAT AAAGTGTAAA GCCTGGGGTG 
CCTAATGAGT GAG CTAACTC ACATTAATTG CGTTGCGCTC ACTGCCCGCT TTCCAGTCGG 
" 5 GAAACCTGTC GTGCCAGCTG CATTAATGAA TCGGCCAACG CGCGGGGAGA GGCGGTTTGC 

GTATTGGGCG CTCTTCCGCT TCCTCGCTCA CTGACTCGCT GCGCTCGGTC GTTCGGCTGC 
GGCGAGCGGT ATCAGCTCAC TCAAAGGCGG TAATACGGTT ATCCACAGAA TCAGGGGATA 
ACGCAGGAAA GAACATGTGA GCAAAAGGCC AGCAAAAGGC CAGGAACCGT AAAAAGGCCG 
CGTTGCTGGC GTTTTTCCAT AGGCTCCGCC CCCCTGACGA GCATCACAAA AATCGACGCT 
35 CAAGTCAGAG GTGGCGAAAC CCGACAGGAC TATAAAGATA CCAGGCGTTT CCCCCTGGAA 

GCTCCCTCGT GCGCTCTCCT GTTCCGACCC TGCCGCTTAC CGGATACCTG TCCGCCTTTC 
TCCCTTCGGG AAGCGTGGCG CTTTCTCAAT GCTCACGCTG TAGGTATCTC AGTTCGGTGT 
40 AGGTCGTTCG CTCCAAGCTG GGCTGTGTGC acgaaccccc cgttcagccc gaccgctgcg 

CCTTATCCGG TAACTATCGT CTTGAGTCGA ACCCGGTAAG ACACGACTTA TCGCCACTGG 
CAGCAGC CAC TGGTAACAGG ATTAGCAGAG CGAGGTATGT AGGCGGTGCT ACAGAGTTCT 
TGAAGTGGTG GCCTAACTAC GGCTACACTA GAAGGACAGT ATTTGGTATC TGCGCTCTGC 
TGAAGCCAGT TACCTTCGGA AAAAGAGTTG GTAGCTCTTG ATCCGGCAAA CAAACCACCG 
50 CTGGTAGCGG TGGTTTTTTT GTTTGCAAGC AGCAGATTAC GCGCAGAAAA AAAGGATCTC 

AAGAAGATCC tttgatcttt tctacggggt ctgacgctca GTGGAACGAA aactcacgtt 
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AAGGGATTTT GGTCATGAGA TTATCAAAAA GGATCTTCAC CTAGATCCTT TTAAATTAAA 
AATGAAGTTT TAAATCAATC TAAAGTATAT ATGAGTAAAC TTGGTCTGAC AGTTACCAAT 
GCTTAATCAG TGAGGCACCT ATCTCAGCGA TCTGTCTATT TCGTTCATCC ATAGTTGCCT 
GACTCCCCGT CGTGTAGATA ACTACGATAC GGGAGGGCTT ACCATCTGGC CCCAGTGCTG 
CAATGATACC GCGAGACCCA CGCTCACCGG CTCCAGATTT ATCAGCAATA AACCAGCCAG 
CCGGAAGGGC CGAGCGCAGA AGTGGTCCTG CAACTTTATC CGCCTCCATC CAGTCTATTA 
ATTGTTGCCG GGAAGCTAGA GTAAGTAGTT CGCCAGTTAA TAGTTTGCGC AACGTTGTTG 
CCATTGCTAC AGGCATCGTG GTGTCACGCT CGTCGTTTGG TATGGCTTCA TTCAGCTCCG 
GTTCCCAACG ATCAAGGCGA GTTACATGAT CCCCCATGTT GTGCAAAAAA GCGGTTAGCT 
CCTTCGGTCC TCCGATCGTT GTCAGAAGTA AGTTGGCCGC AGTGTTATCA CTCATGGTTA 

tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 

GTGAGTACTC AACCAAGTCA TTCTGAGAAT AGTGTATGCG GCGACCGAGT TGCTCTTGCC 
CGGCGTCAAT ACGGGATAAT ACCGCGCCAC ATAGCAGAAC TTTAAAAGTG CTCATCATTQ 
GAAAACGTTC TTCGGGGCGA AAACTCTCAA GGATCTTACC GCTGTTGAGA TCCAGTTCGA 
TGTAACCCAC TCGTGCACCC AACTGATCTT CAGCATCTTT TACTTTCACC AGCGTTTCTG 

ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 

GTTGAATACT CATACTCTTC CTTTTTCAAT ATTATTGAAG CATTTATCAG GGTTATTGTC 
TCATGAGCGG atacatattt gaatgtattt agaaaaataa acaaataggg GTTCCGCGCA 
CATTTCCCCG AAAAGTGC CA CCTGACGTCG A CGGATCGGG 

(2) INFORMATION ZU SEQ ID NO: 38: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 7108 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) IiAGE : 1..7108 
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(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 38: 

AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT TGTTCTCGTT SO 

AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC GATGGACAAG TGCATTGTTC 120 

TCTTGCTGAA AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC AGTACCCGGG 180 

AGTACCCTCG ACCGCCGGAG TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT 240 

TCAAACAAGC AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 300 

QAACAAGCTA aacaatctgc AGTAAAGTGC AAGTTAAAGT GAATCAATTA aaagtaacca 3 60 

GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA GAAGTAATTA TTGAATACAA 4 20 

GAAGAGAACT CTGAATACTT tcaacaagtt accgagaaag AAGAACTCAC acacagctag 48 0 

CGTTTAAACT TAAGCTTGGT ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGGAATTCGG S40 

CTTGGGATGA CGCCTCCTCC GCCCGGACGT GCCGCCCCCA GCGCACCGCG CGCCCGCGTC 6 00 

CCTGGCCCGC CGGCTCGGTT GGGGCTTCCG CTGCGGCTGC GGCTOCTGCT GCTGCTCTGG 660 

GCGGCCGCCG CCTCCGCCCA GGGCCACCTA AGGAGCGGAC CCCGCATCTT CGCCGTCTGG 720 

AAAGGCCATG TAGGGCAGGA CCGGGTGGAC TTTGGCCAGA CTGAGCCGCA CACGGTGCTT 780 

TTCCACGAGC CAGGCAGCTC CTCTGTGTGG GTGGGAGGAC GTGGCAAGGT CTACCTCTTT 840 

GACTTCCCCG AGGGCAAGAA CGCATCTGTG CGCACGGTGA ATATCGGCTC CACAAAGGGG 900 

TCCTGTCTGG ATAAGCGGGA CTGCGAGAAC TACATCACTC TCCTGGAGAG GCGGAGTGAG 960 

GGGCTGCTGG CCTGTGGCAC CAACGCCCGG CACCCCAGCT GCTGGAACCT GGTGAATGGC 1020 

ACTGTGGTGC CACTTGGCGA gatgagaggc TACGCCCCCT TCAGCCCGGA CGAGAACTCC 1080 

CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT TCCACCATCC GGAAGCAGGA ATACAATGGG 1140 

AAGATCCCTC GGTTCCGCCG CATCCGGGGC GAGAGTGAGC TGTACACCAG tgatactgtc 
atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc TTACGATGAC 1260 

aagatctact acttcttccg agaggacaat cctgacaaga atcctgaggc tcctctcaat 
gtgtcccgtg tggcccagtt gtgcaggggg gaccagggtg gggaaagttc actgtcagtc 1380 

tccaagtgga acacttttct gaaagccatg ctggtatgca gtgatgctgc caccaacaag 
aacttcaaca ggctgcaaga cgtcttcctg ctccctgacc ccagcggcca GTGGAGGGAC 1500 

ACCAGGGTCT ATGGTGTTTT CTCCAACCCC TGGAACTACT CAGCCGTCTG TQTGTATTC C 1560 
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TCCTCACTCA AGGGCTACCA CTCAAGCCTT 
GACCAGCAGC CGATACCCAC AGAGACCTTC 
CAGAGGGTGG AGCCCATGGG GCCTCTGAAG 
CAGAAAGTGG CCGTTCACCG CATGCAAGCC 
CTAACTACAG ACAGGGGCAC TATCCACAAG 
TTCGCCTTCA ACATCATGGA GATCCAGCCC 
tcgctggatg CTGAGCGGAG GAAGCTGTAT 
CCCCTGGACC TGTGTGAGGT CTATGGCGGG 
CCCTACTGCG GCTGGGACCA GGGCCGCTGC 
CTGCAATCCA TTAATCCAGC CGAGCCACAC 
GCCCCACTGC AGAAGGTTTC CCTGGCCCCA 
GAATCCCGCC ACGCCACCTA CTCATGGCGC 
CCTGGTCACC AGAGCCCCAA CTGCATCCTG 
GGCCACTACT TCTGCGAGGC CCAGGAGGGC 
CTGCTGCCCG AGGACGGCAT CATGGCCGAG 
gcctccctct GGCTGGGGGT GCTGCCCACA 
CTTGGGCCCG AACAAAAACT CATCTCAGAA 



CTCGGTGACA TTGACAAGGT CTTCCGTACC 
CCCAACCCGC GGCCTGGCAA GTGCCTCCCA 
CAGGTGGCTG ACCGTCACCC AGAGGTGGCG 
ACGCCATTGT TCCACTCTAA ATACCACTAC 
AGCCACGGGG AGACCTTTCA TGTGCTTTAC 
GTGGTGGAAC CGGGGGAGCA GGAGCACAGC 
ttccgccgcg CGGCTGCCAT CCAGACCATG 
gtgagctccc AGTGGGAGGT GAGCCAGGTG 
ggc tgccacg gttgcctcat gtcccgagac 
atctccatct acagctccga acggtcagtg 
aaggagtgtc ccaaccccaa accagacaag 
aactctcgct actacctgag ctgccccatg 
cacaaggaga acgtggagca gagctgcgaa 
ttcatcgaga acctcacggc gcagcagtac 
tcctacttcc gcgaggctca gcactggcag 
cacctgctgg gtcatgcctg tgccctggct 

CTCACTCTTG GCTTGCTGGT CCACGTGAAG 
GAGGATCTGA ATAGCGCCGT 
TGGCGGCCGC TCGAGTCTAG AGGGCCCGTT 

tctagttgcc agccatctgt tgtttgcccc 
gccactccca ctgtcctttc ctaataaaat 
tgtcattcta ttctgggggg tggggtgggg 
aatagcaggc atgctgggga tgcggtgggc 
tggggctcta gggggtatcc ccacgcgccc 



TAAACCCGCT GATCAGCCTC GACTGTGCCT 

tcccccgtgc cttccttgac cctggaaggt 
gaggaaattg catcgcattg tctgagtagg 
caggacagca agggggagga ttgggaagac 
tctatggctt ctgaggcgga aagaaccagc 
tgtagcggcg cattaagcgc ggcgggtgtg 



gtggttacgc gcagcgtgac cgctacactt 
ttcttccctt cctttctcgc cacgttcgcc 

ATCCCTTTAG GGTTCCGATT TAGTGCTTTA 

ggtgatggtt cacgtagtgg gccatcgccc 



GCCAGCGCCC TAGCGCCCGC TCCTTTCGCT 

ggctttcccc gtcaagctct aaatcggggc 
cggcacctcg accccaaaaa acttgattag 
tgatagacgg tttttcgccc tttgacgttg 
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GAGTCCACGT TCTTTAATAG TGGACTCTTG 
TCGGTCTATT CTTTTGATTT ATAAGGGATT 
GAGCTGATTT AACAAAAATT TAACGCGAAT 
GTGGAAAGTC CCCAGGCTCC CCAGGCAGGC 
TCAGCAACCA GGTGTGGAAA GTCCCCA GGC 
CATCTCAATT AGTCAGCAAC CATAGTCCCG 
CCGCCCAGTT CCGCCCATTC TCCGCCCCAT 
GCCGAGGCCG CCTCTGCCTC TGAGCTATTC 
CTAGGCTTTT GCAAAAAGCT CCCGGGAGCT 
ACAGGATGAG GATCGTTTCG CATGATTGAA 
GCTTGGGTGG AGAGG CT ATT CGGCTATGAC 
GCCGCCGTGT TCCGGCTGTC AG CGCAGGGG 
TCCGGTGCCC TGAATGAACT GCAGGACGAG 
GGCGTTCCTT G CG CAGCTGT GCTCGACGTT 
TTGGGCGAAG TGCCGGGGCA GGATCTCCTG 
TCCATCATGG CTGATGCAAT GCGGCGGCTG 
GACCACCAAG CGAAACATCG CATCGAGCGA 
GATCAGGATG ATCTGGACGA AGAGCATCAG 
CTCAAGGCGC GCATGCCCGA CGGCGAGGAT 
CCGAATATCA TGGTGGAAAA TGGCCGCTTT 
GTGGCGGACC GCTATCAGGA CATAGCGTTG 
GGCGAATGGG CTGACCGCTT CCTCGTGCTT 
ATCGCCTTCT ATCGCCTTCT TGACGAGTTC 
CCGACCAAGC GACGCCCAAC CTGCCATCAC 
AAAGGTTGGG CTTCGGAATC GTTTTCCGGG 
ATCTCATGCT GGAGTTCTTC GCCCACCCCA 
AATAAAGGAA TAG CATC AC A AATTTCACAA 



TTCCAAACTG GAACAACACT CAACCCTATC 
TTGGGGATTT CGGCCTATTG GTTAAAAAAT 
TAATTCTGTG GAATGTGTGT CAGTTAGGGT 
AGAAGTATGC AAAGCATGCA TCTCAATTAG 
TCCCCAGCAG GCAGAAGTAT GCAAAGCATG 
CCCCTAACTC CGCCCATCCC GCCCCTAACT 
GGCTGACTAA TTTTTTTTAT TT ATG CAG AG 
CAGAAGTAGT GAGGAGGCTT TTTTGGAGGC 
TGTATATCCA TTTTCGGATC TGATCAAGAG 
CAAGATGGAT TGCACGCAGG TTCTCCGGCC 
TGGGCACAAC AGACAAT CGG CTGCTCTGAT 
CGCCCGGTTC TTTTTGTCAA GACCGACCTG 
GCAGCGCGGC TATCGTGGCT GGC CACGACG 
GTCACTGAAG CGGGAAGGGA CTGGCTGCTA 
TCATCTCACC TTGCTCCTGC CGAGAAAGTA 
CATACGCTTG ATCCGGCTAC CTGCCCATTC 
GCACGTACTC GGATGGAAGC CGGTCTTGTC 
GGGCTCGCGC CAG C CGAACT GTTCGCCAGG 
CTCGTCGTGA CCCATGGCGA TGCCTGCTTG 
TCTGGATTCA TCGACTGTGG CCGGCTGGGT 
GCTACCCGTG ATATTGCTGA AGAGCTTGGC 
TACGGTATCG CCGCTCCCGA TTCGCAGCGC 
TTCTGAGCGG GACTCTGGGG TTCGAAATGA 
GAGATTTCGA TTCCACCGCC GC CTTCTATG 
ACGCCGGCTG GATGATCCTC CAGCGCGGGG 
ACTTGTTTAT TGCAGCTTAT AATGGTTACA 
ATAAAGCATT TTTTTCACTG CATTCTAGTT 
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GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG TATACCGTCG ACCTCTAGCT 
AGAGCTTGGC GTAATCATGG TCATAGCTGT TTCCTGTGTG AAATTGTTAT CCGCTCACAA 
TTCCACACAA CATACGAGCC GGAAGCATAA AQTGTAAAGC CTGGGGTGCC TAATGAGTGA 

gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aaccigtcgt 
gccagctgca ttaatgaatc ggccaacgcg CGGGGAGAGG CGGTTTGCGT attgggcgct 
CTTCCGCTTC CTCGCTCACT QACTCGCTGC GCTCQGTCGT TCGGCTGCGG CGAGCGGTAT 
CAGCICACTC AAAGGCGGTA ATACGGTTAT CCACAGAATC AGGGGATAAC GCAGGAAAGA 
ACATGTGAGC AAAAGGCCAG CAAAAGGCCA GGAACCGTAA AAAGGCCGCG TTGCTGGCGT 
TTTTCCATAG gctccgcccc cctgacgagc atcacaaaaa tcgacgctca AGTCAGAGGT 
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc cgctggaagc tccctcgtgc 

GCTCTCCTGT TCCGACCCTG CCGCTTACCG GATACCTGTC CGCCTTTCTC CCTTCGGGAA 
GCGTGGCGCT TTCTCAATGC TCACGCTGTA GGTATCTCAG TTCGGTGTAG GTCGTTCGCT 
CCAAGCTGGG CTGTGTGCAC GAACCCCCCG TTCAGCCCGA CCGCTGCGCC TTATCCGGTA 

actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 

GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC AGAGTTCTTG AAGTGGTGGC 
CTAACTACGG CTACACTAGA AGGACAGTAT TTGGTATCTG CGCTCTGCTG AAGCCAGTTA 
CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT CCGGCAAACA AACCACCGCT GGTAGCGGTG 
GTTTTTTTGT TTGCAAGCAG CAGATTACGC GCAGAAAAAA aggatctcaa GAAGATCCTT 
TGATCTTTTC TACGGGGTCT GACGCTCAGT GGAACGAAAA CTCACGTTAA GGGATTTTGG 
TCATGAGATT ATCAAAAAGG ATCTTCACCT AGATCCTTTT AAATTAAAAA TGAAGTTTTA 

aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 
aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg 

TGTAGATAAC TACGATACGG GAGGGCTTAC CATCTGGCCC CAGTG CTGCA ATGATACCGC 
GAGACCCACG CTCACCGGCT CCAGATTTAT CAGCAATAAA CCAGCCAGCC GGAAGGGCCG 
aocgcagaag tggtcctgca ACTTTATCCG cctccatcca GTCTATTAAT TGTTGCCGGG 
aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 

GCATCGTGGT GTCACGCTCG TCGTTTGGTA TGGCTTCATT CAGCTCCGGT TCCCAACGAT 
CAAGGCGAGT TACATGATCC CCCATGTTGT GCAAAAAAGC GGTTAGCTCC TTCGGTCCTC 
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CGATCGTTGT 

ATAATTCTCT 

CCAAGTCATT 

GGGATAATAC 

CGGGGCGAAA 

gtgcacccaa 

CAGGAAGGCA 

TACTCTTCCT 

ACATATTTGA 

ARnTHfCACC 



CAGAAGTAAG 

tactgtcatg 

CTGAGAATAG 

CGCGCCACAT 

ACTCTCAAGG 

CTGATCTTCA 

aaatgccgca 

ttttcaatat 

atgtatttag 



ttggccgcag 

CCATCCGTAA 

tgtatgcggc 

agcagaactt 

atcttaccgc 

gcatctttta 

aaaaagggaa 

tattgaagca 

aaaaataaac 



TGTTATCACT 

GATGCTTTTC 

GACCGAGTTG 

TAAAAGTGCT 

tgttgagatc 

CTTTCACCAG 

TAAGGGCGAC 

tttatcaggg 

aaataggggt 



catggttatg 

tgtgactggt 

CTCTTGCCCG 

CATCATTGGA 

cagttcgatg 

cgtttctggg 

acggaaatgt 

ttattgtctc 

tccgcgcaca 



gcagcactgc 

gagtactcaa 

OCGTCAATAC 

AAACGTTCTT 

TAACCCACTC 

XGAGCAAAAA 

tgaatactca 

ATGAGCGGAT 

tttccccgaa 



'rr'fc.mTCGAC 






(2) INFORMATION ZU SEQ ID NO: 39: 

(i) SEQOENZ CHARAKTERISTIKA: 

(A) LANGE: 4019 Basenpaare 

(B) ART: Nukleins&ure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGXE : linear 

(ii) ART DBS MOLBK0LS: DNS (genomisch) 



fix) 



MERKMALE : 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..4019 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 39: 
CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA 
ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG 
GGAT CGCAT C ACCATCACCA TCACGGATCC CTGGTTCTGT 
TCCACCATCC GGAAGCAGGA ATACAATGGG AAGATCCCTC 



TAACAATTAT AATAGATTCA 
aggagaaatt AACTATGAGA 
ttgaagggga CGAGGTGTAT 
ggttccgccg CATCCGGGGC 



TTJVCQRTOAC W*ATCT»CT ACTTOTCCO 



CCTGACAAGA ATCCTGAGGC TCCTCTCAAT GTOTCCCGTG 

gaccagggtg gggaaagttc actgtcagtc tccaagtgga 



tggcccagtt GTGCAGGGGG 
ACACTTTTCT OAAAGCCATG 
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CTGGTATGCA GTGATGCTGC CACCAACAAG 
CTCCCTGACC CCAGCGGCCA GTGGAGGGAC 
TGGAACTACT CAGC CGTCTG TGTGTATTCC 
TCCTCACTCA AGGGCTACCA CTCAAGCCTT 
GACCAGCAGC CGATACCCAC AGAAAGCTTA 
TCCAGTAATG AC CTCAGAAC TCCATCTGGA 
GTTTTTTATT GGTGAGAATC CAAGCTAGCT 
aaatggagaa aaaaatcact GGATATACCA 
aacattttga ggcatttcag tcagttgctc 
atattacggc ctttttaaag accgtaaaga 

TTCACATTCT TGCCCGCCTG ATGAATGCTC 

GTGAGCTGGT gatatgggat agtgttcacc 
aaacgttttc atcgctctgg agtgaatacc 
attcgcaaga tgtggcgtgt tacggtgaaa 
agaatatgtt tttcgtctca gccaatccct 
tggccaatat ggacaacttc ttcgcccccg 
gcgacaaggt 

ATGTCGGCAG AATGCTTAAT GAATTACAAC 

aattttttta aggcagttat tggtgccctt 
aggcatcaaa taaaacgaaa ggctcagtcg 
ttgtcggtga acgctctcct gagtaggaca 
ttcggtgatg acggtgaaaa cctctgacac 

CTGTAAGCGG ATGCCGGGAG CAGACAAGCC 

tgtcggggcg CAGCCATGAC ccagtcacgt 
atgcggcatc AGAGCAGATT gtactgagag 
gatgcgtaag gagaaaatac cgcatcaggc 
tgcgctcggt ctgtcggctg cggcgagcgg 



aacttcaaca ggctgcaaga cgtcttcctg 
accagggtct atggtgtttt ctccaacccc 
ctcggtgaca ttgacaaggt cttccgtacc 
cccaacccgc ggcctggcaa gtgcctccca 

ATTAGCTGAG CTTGGACTCC TOTTGATAGA 

tttgttcaga acgctcggtt gccgccgggc 
tggcgagatt ttcaggagct aaggaagcta 

CCGTTGATAT ATCCCAATGG CAT CGT AAAG 

aatgtaccta taaccagacc gttcagctgg 
aaaataagca caagttttat ccggccttta 

ATCC GGAATT TCGTATGGCA ATGAAAGACG 

cttgttacac cgttttccat GAGCAAACTG 
acgacgattt ccgg cagttt ctacacatat 
acctggccta tttccctaaa gggtttattg 
gggtgagttt caccagtttt gatttaaacg 
riT TCACCAT gggcaaatat tatacgcaag 
tgccgtctgt gatggcttcc 
agtactgcga tgagtggcag ggcggggcgt 
aaacgcctgg ggtaatgact ctctagcttg 
aaagactggg cctttcgttt tatctgttgt 
aatccgccgc tctagagctg cctcgcgcgt 
atgcagctcc cggagacggt cacagcttgt 

CGTCAGGGCG CGTCAGCGGG TGTTGGCGGG 

agcgatagcg GAGTGTATAC tggcttaact 
tgcaccatat gcggtgtgaa ataccgcaca 
gctcttccgc ttcctcgctc actgactcgc 

TATCAGCTCA CTCAAAGGCG GTAATACGGT 



gctgatgccg ctggcgattc aggttcatca 
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TAT CC AC AG A ATCAGGGCAT AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG 
CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG 
AGCATCACAA AAATCGACGC tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct 

GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC 

ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 
5 gacacgactt atcgccactg gcagcagcca ctggtaacag GATTAGCAGA gcgaggtatg 

TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGGACAG 

TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT 

•0 GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA 

CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC 

AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA AGGATCTTCA 

* CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA 

CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT 

TTCGTTCATC CATAGCTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT 

30 

TACCATCTGG CCCCAGTGCT GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGA 

tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct GCAACTTTAT 

35 CCGCCTCCAT CCAGTCTATT AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA 

atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 

GTATGGCTTC ATTCAGCTCC GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT 

40 TGTGCAAAAA agcggttagc tccttcggtc ctccgatcgt tgtcagaagt AAGTTGGCCG 

CAGTGTTATC ACTCATGGTT ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG 

TAAGATGCTT TTCTGTGACT GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC 

45 GGCGACCGAG TTGCTCTTGC CCGGCGTCAA T ACGGGAT AA TACCGCGCCA CATAGCAGAA 

CTTTAAAAGT GCTCATCATT GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC 

CGCTGTTGAG ATCCAGTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT 
50 

TTACTTTCAC CAGCGTTTCT GGGTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG 
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5 



gaataagggc gacacggaaa tgttgaatac tcatactctt 

GCATTT AT CA GGGTTATTGT CTCATGAGCG GATACATATT 

aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 

TTATTATCAT GACATTAACC TATAAAAATA GGCGTATCAC 



CCTTTTTCAA TATTATTGAA 
TGAATGTATT TAGAAAAATA 
AC CTGACGTC TAAGAAACCA 

gaggcccttt cgtcttcac 
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(2) INFORMATION ZU SEQ ID NO: 40: 

(i) SEQUENZ CHARAKTBRISTIKA: 

(A) L&NGE: 3999 Basenpaare 

(B) ART: Nukleinsiure 

(C) STRANGFORM: Binzel 

(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEK0LS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..3999 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 40. 

CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA 
attgtgagcg GATAACAATT TCACACAGAA TTCATTAAAG 
ggatcgcatc accatcacca tcacacggat ccgcatgcga 

CAGGTGCCCC TGGACCTGTG TGAGGTCTAT GGCGGGGGCT 
CGAGACCCCT ACTGCGGCTG GGACCAGGGC CGCTGCATCT 

tcagtgctgc aatccattaa tccagccgag ccacacaagg 
gacaaggccc cactgcagaa ggtttcc ctg gccccaaact 
cccatggaat cccgccacgc cacctactca tggcgccaca 
tgcgaacctg gtcaccagag ccccaactgc atcctgttca 

CAGTACGGCC ACTACTTCTG CGAGGCCCAG GAGGGCTCCT 

tggcagctgc tgcccgagga cggcatcatg gccgagcacc 

CTGGCTGCCT CCCTCTGGCT GGGGGTGCTG CCCACACTCA 
GTGAAGCTTA ATT AGCT GAG CTTGGACTCC TGTTGATAGA 

tccatctgga tttgttcaga acgctcggtt gccgccgggc 



taacaattat 

aggagaaatt 

GCTCCCAGTG 

gccacggttg 

CCATCTACAG 

AGTGTCCCAA 

CTCGCTACTA 

AGGAGAACGT 

tcgagaacct 

acttccgcga 

TGCTGGGTCA 
CTCTTGGCTT 
TCCAGTAATG 
GTTTTTTATT 



AATAGATTCA 

AACTATGAGA 

ggaggtgagc 

CCTCATGTCC 

ctccgaacgg 

CCCCAAACCA 

CCTGAGCTGC 

ggagcagagc 

CACGGCGCAG 

GGCTCAGCAC 

tgcctgtgcc 
gctggtccac 
acctcagaac 
ggtgagaatc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 



55 



103 




EP 0 892 047 A2 



CAAGCTAGCT TGGCGAGATT TTCAGGAGCT AAGGAAGCTA AAATGGAGAA AAAAATCACT 900 

GGATATACCA CCGTTGATAT ATCCCAAT GO CATCGTAAAG AACATTTTGA GGCATTTCAG 960 

TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG ATATTACGGC CTTTTTAAAG 1020 

ACCGTAAAGA AAAATAAGCA CAAGTTTTAT CCGGCCTTTA TTCACATTCT TGCCCGCCTG 1080 

)0 ATGAATGCTC ATCCGGAATT TCGTATGGCA ATGAAAGACG GTGAGCTGGT GATATGGGAT 1140 

AGTGTTCACC CTTGTTACAC CGTTTTCCAT GAGCAAACTG AAACGTTTTC ATCGCTCTGG 1200 

AGTGAATACC ACGACGATTT CCGGCAGTTT CTACACATAT ATTCGCAAGA TGTGGCGTGT 1260 

15 tacggtgaaa acctggccta TTTCCCTAAA GGGTTTATTG AGAATATGTT TTTCGTCTCA 1320 

GCCAATCCCT GGGTGAGTTT CACCAGTTTT GATTTAAACG TGGCCAATAT GGACAACTTC 1380 

TTCGCCCCCG TTTTCACCAT GGGCAAATAT TATACGCAAG GCGACAAGGT GCTGATGCCG 1440 

20 

CTGGCGATTC AGGTTCATCA TGCCGTCTGT GATGGCTTCC ATGTCGGCAG AATGCTTAAT 1500 

GAATTACAAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT AATTTTTTTA AGGCAGTTAT 1560 

25 TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG AGGCATCAAA TAAAACGAAA 1620 

GGCTCAGTCG AAAGACTGGG CCTTTCGTTT TATCTGTTGT TTGTCGGTGA ACGCTCTCCT 1680 

GAGTAGGACA aatccgccgc TCTAGAGCTG CCTCGCGCGT TTCGGTGATG ACGGTGAAAA 1740 

30 

CCTCTGACAC ATGCAGCTCC CGGAGACGGT CACAGCTTGT CTGTAAGCGG ATGCCGGGAG 1800 

CAGACAAGCC CGTCAGGGCG CGTCAGCGGG TGTTGGCGGG TGTCGGGGCG CAGCCATGAC 1860 

35 CCAGTCACGT AGCGATAGCG GAGTGTATAC TGGCTTAACT ATGCGGCATC AGAGCAGATT 1920 

GTACTGAGAG TGCACCATAT GCGGTGTGAA ATACCGCACA GATGCGTAAG GAGAAAATAC 1980 

CGCATCAGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CTGTCGGCTG 2040 

40 CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT 2100 

AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC 2160 
4g GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC 2220 

TCAAGTCAGA GGTGGCGAAA CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA 228 0 

AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT 2340 

50 CTCCCTTCGG GAAGCGTGGC GCTTTCTCAA TGCTCACGCT GTAGGTATCT CAGTTCGGTG 2400 

TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC CCGTTCAGCC CGACCGCTGC 2460 

55 
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GCCTTATCCG GTAACTATCG TCTTGAGTCC AACC CGGTAA GACACGACTT ATCGCCACTG 
GCAGCAGCCA CTGGTAACAG GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC 

ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg 

CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC 

gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 

CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT 

taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa 
aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa 
tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catag^gcc 

TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG CCCCAGTGCT 

gcaatgatac cgcgagaccc acgctcaccg gctccagatt TATCAGCAAT aaaccagcca 
gccggaaggg ccgagcgcag aagtcgtcct gcaactttat ccgcctccat ccagtctatt 
5 aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt 

gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc 
ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc 
tccttcggtc ctccgatcgt TOTCAGAAGT AAGTTGGCCG cagtgttatc actcatggtt 
AT ggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact 
* ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcitgc 

CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCTCATCATT 

ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg 
atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct 
gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa 
4S tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt 

CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC 

acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat GACATTAACC 
tataaaaata ggcgtatcac gaggcccttt CGTCTTCAC 
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(2) ANGABEN ZU SEQ ID NO: 41: 

(i) SEQUBNZKENNZEICHEN: 

(A) lAnGE: 8800 Basenpaare 

(B) ART: Nucleotid 

(c) STRANGFORM: Eiazelstrang 
(D) TOPOLOGIE: linear 

(ii) ART DBS MOLBKOlS : Genom-DNA 



15 



25 



30 



35 



40 



45 



50 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGS 8888 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 41 

AGCCGCACA CGGTGCTTTT CCACGAGCCA GGCAGCTCCT 
rGCAAGGTCT ACCTCTTTGA CTTCCCCGAG GGCAAGAACG 
JTCTCTCTTC CCCCAACACC CCCCCTACCC TCTTATCTCC 
; C TCAGGGAA TCCGAGGGAG CTGGCTTCTC TTCCTAAACT 
rAAATGGCTC CTGGGGGAGG CTCCCTAAAG GTAGTCCAGA 
3GTGTGGAGA AAAACAGGAG CTAATGGGCC TGGCCAGCTG 
CCCAGGCTGG AAGCTGGGCC CCAGAGCCCA TGCCTGGTCT 

gctctggata tgagaccctg tttgacctca ggtagatcac 
ttgctcatct gtcagatgag aataatggtt gcttcctttg 
tggaaagcat ttcaggggta cctcacccct ggcagattga 
ccaggtgaat atcggctcca caaaggggtc ctgtctggat 

GATCTGGAGG GGTCTGAGCC ACTTGGTAAA GGGAGAGGAG 

gaagcatggc cctgccccac gagtcccaga ctgatgggga 
ggggatggcg tcagctgcac ACACTCTGGG CTGTCCCGGG 
CCCTTCTGAC ACCTrCTTCC CTGATCCTGG GGGTCCTAGT 
CCAGCAACCA ATTTCTCTCC TCCCTTCTCT CTTCCCCGGG 
CACTCTCCTG GAGAGGCGGA GTGAGGGGCT GCTGGCCTGT 
CAGCTGCTGG AACCTGGTGA GAAGGCTGCT CCCCATGTGC 
TGCGTGGGCT TCTGCCCCTC ATGGTGGGAA GGAGATGGCG 



CTGTGTGGGT 
CATCTGTGCG 
CCTCTGGCCC 
GCCCCCACCT 

ttggagtggg 

ggcagcgctg 

TCTGAACCCT 

tcaccctctc 
gggcttatcc 
actaatgctt 
aagcgggtga 
accctgaggg 
gacgtggtcc 
aggctgtcac 
gctaggcttg 
caggactgcg 
ggcaccaacg 
ctgatcagct 

AGACTCCAAT 



gggaggacgt 

cacggtgagc 

tgccaagggt 

ccgtatccta 

gagctggggc 

CTGCGGAAAG 

ctgggcctca 
agagccccag 
tgaggctgtg 
ctccccttcc 
gcgggggagg 
tctaaggaag 
tctgtgctta 
ctatgctaag 
ccagggcctt 
agaactacat 

CCCGGCACCC 
caccttctac 
gctggccttg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 
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CCCTGGGAGG ATGGGGCTCC TGGCCGAGAA 

gattatgtgg ccatccaacc ctctggatct 
tggcgagatg agaggctacg cccccttcag 



actggccgtc atgggaggca gtggctgtgg 

CCCACAGGTG AATGGCACTG TGGTGCCACT 
CCCGGACGAG AACTCCCTGG TTCTGTTTGA 



aggttggggc atgcttcgga ACTGGGCTGG 

CCGGAGGAGG GACTTCCAGG AGCTGCCTGC 

aggggacgag gtgtattcca ccatccggaa 

CCGCCGCATC CGGGGCGAGA GTGAGCTGTA 
AGGCTCCGGC TGGGCTGAGG GTGGGCAAGG 



gagcaggatg gtcagctctt tgtccagtgt 

CCTTACTCAT TTCTCCCTCC CACTGACCCC 

gcaggaatac aatgggaaga tccctcggtt 

CACCAGTGAT ACTGTCATGC AGAGTGAGTC 

gggtgtgagc acttaaggtg gcagatggga 



tcctgatgtt tctgggaggg 



CTCCCTGAGG GCCGCTGGGG CCATGCAGGA AAGCAGGACC 



ttggtatagg 
gtgggatggg 
ggtccccagg 

CCTCCTCATC 

CCCCACTCCC 

gcaaaacagg 

gttatgagtc 

agagtgtgca 

tctgtgccct 

acgatgacaa 

ctctcaatgt 

gctacgtgtc 

gtagaagttg 

tgcatggagc 

atggcgtgtg 

gtgtgaatgt 

gtctgctctg 

GGCTCTGGAT 



cctgagaagt 

CCCAGCCCTC 
agccaaagtt 
agggctctgc 
caggcatgaa 
tgtggggtgg 

CTATTCCAGA 

gggttggaat 

GGCAGACCCA 

GATCTACTAC 

gtcccgtgtg 

tgtgcatgaa 

tgtggatgta 

atcatgtgtc 

agcgtgtgta 

gctgtgccac 

tggggacctg 

cagccaggcc 



tagggttggc 

ttcaggaaca 

tatcctctgc 

CAATTGAGCA 

gtcattgctc 

aggtgcaggg 

tctgatttgc 

ggtctcccgg 

cagttcatca 

ttcttccgag 

gcccagttgt 

taggcctgag 

tgagtgggtc 

tgtgtgtggg 

tgatggggtg 

gtatgtgggt 

G CACTCTCAC 

tgcttgca gg 



CGGCAGGTCC TGGCCCCTCG 



tgggagcaga 
caaacagagg 
tgagttcacg 
gaagtgacat 
ctgggccgat 
tctagggccc 

CATGGTTTGT 

gcaagcttcc 
aagccaccat 
aggacaatcc 
gcagggtgaa 
tgagggtgag 
tgtgtcaggg 
taaaggtggc 
tgtgtgtgtg 
gcgtgagtca 
ctgccctgac 
agtctcatct 
(-ar^rrTGCCT 



ggaacagaca 
gagccccaga 
tggaggcagc 
aggggccccc 
gacatctttg 

CTCGGGGAGT 

GCAGACCCGA 

cagccttacg 

CGTGCACCAA 

TGACAAGAAT 

CACGGGCGTG 

ttctgtgtgt 

actgtgggag 

tgagctcctg 

tgtgtgtgtg 

gtaaatgtgt 

CCTGGGCACT 

ggagacctgc 

'rr’PTCCTCTG 



AGGTATAGCA 

CCCAGTGCAG 

CCCCCAACTC 

AGGGACCTTC 

taggaagagg 
tggacctgat 
aggagggagg 
cccattcgct 
gaccaggctt 
cctgaggctc 
agggctgctg 
ccgtgtgcat 
cagctgtgtg 
tgcacgtatg 
tgttttgcct 
gtctgagtcc 
gctggccctg 
cctgagtcct 

fWCCCAGGTG 
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1260 
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1560 
1620 
1680 
1740 
1800 
I860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
. 2520 
2580 
2640 
2700 
2760 
2820 



55 



107 




EP 0 892 047 A2 



5 



10 



15 



20 



25 



30 



35 



40 



45 



SO 



TTGATATTGC TOGCAGKA*. TTCGTGGGGT GTGTGGGGAA GCCCGGOGAO «rG™»GGG 

gcctcttctc cccictaccc itccaggggg acgagggtgg ggaaagttca 
gcaagtogaa cacttttctq aankcatgc tgg*»t»cag tOMOHKC ACCAACAAGA 
ACTMACAO GCTGCAAGAC GTCTCCTCC TCCGTOACCC CA^GOCCAG TGGAGOGAG. 
gcaggotcta tgg™™c tccaagccct goto^c ccttgig™ °““ 0M ° C 
tggcatiggt tcagtgtcca CT agggacag gasgccttgg gcccggctca gggccccct 

Gg^GGOG, GAOCAGGGGC GGC**^ AGAGGCTCGG 

GGGGGACAGG CAGTCGGA™ T. ro TA™r TOTOTOAOTQ ^XCTGGAC CAGGGGTGtG 
tgtgcatocc ctatatocac actcaigact gg«c™™c ctgtctgtcc <*— 
tro „eC G A. AGTGGACAGT OGOCCCAGGA OGAAGCTOCT GAAGCATCTC TGGGGGAGGT 
GGGTOCTATT AOAGCTGCTC agGCACTGCC TGAGCCCGAT AATTCACACT TCITAATCAC 
gcpcatmat tgaacacacg gcaggcggaa ™™GGrc tototogga GAGTTAGGGA 
TAGAG1GGAO GAAGCCAAGA CCCIGCTCTG xQGCTCCTQG GTGAGTCGGT CCCCCAGGCT 
GggUAGGGT GGGGGGTCG GCCTCCTGGG OCATCAGCAC CCCACAGCGT GTGCCCAGGG 
AGG<k™«AG AACTOCtGAG CCT,™.GGG GGrrCGGCC GCO^GO* TGGG»GAGC 
AGA1GGCCTC TAGACTGAGT G.TTCTC.A. CAGGATAGM, „A»™CA 

GCACAA^AA ATTAAGc™. ACTCCTCTCC ™=TGG,cr CCATCCCTCC CCA^TCA. 

gggmgttgo caacpcaoto ccaggcacaa ggggggc™ ggtgagt«a ggtgga^gg 

TGGOTTCTQG GCCCCCCATT OAGG1GGICT CCATGTCACI G»GGAACT, CCAGCCOTC 
TGTGGGTAGT CCCTCCGTOA CAHGACAAO G^TCCGTA CCTCCtCACT CAAOGGGTAG 
CACTCAAGCC TTGCCAACCC GCGGCCTGGC AAGGTGAGCG TGACACCAGC CGTGGCCCAG 

gcccagccct ccttctgcct cacctcccac cacccca™ accigggcct gctctccttg 

CCCAGGGCCT CCCAGACCAG CAOCCGATAC CCACA^C CTTCG«»TG GCTGACCGTC 

accgagaggt ggcocaoagg giggagccca tggogcctc, gaagacggca ttottccact 

CTAAATACCA CTACCAQAAA GTGGCCGGCC ACCGCATGCA AGCCAGCCAC OCOGAOkCCT 
TTCATGTGCT TTACCTAACT AGAGOTGAGA GGCTACCCCG GGACCCTCAG TTTGOTTGT 
ugaaacgggc atgaaaggto taaogaataa tgtagttaac atctogitog atcttocat 
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GTGGAAGGAA TAATTGAGTG ACTGGAGTTG TCAGGGGTTA ATGTGTGTGG GTGTGGAAGA 
GCCAGGCAGG GAGAGCTTCC tggaggaggt aggggcaaga gggaaagggg gatgggagaa 
aagcaagcac tgggatttgg aggcggaaat ctggagagtc tgagcaaagc caggtgcacc 
tttggtccag atgtctgact cagggaagaa gatggtagga agagacgtgg caaatgagga 
ggaggggcct gaaccacagg gatactggcc tctgccaggc agaatgaggg agtcaggccc 

TGCGCCTGTC TTTGGGATTG TGCAGGTGAG AAGAAACATT TGAGGAOTTG ATGGGGCACA 

aattaggtat ggggaaggag ttccaggggg cagaaccttt gccatctcac AGAGGACAGG 
5 ggcagcttct cttcttccct ggagtaggcc ctgctggggg aagctgggtg gaatgccgtg 

GGAGATGCTC CTGCTTTCTG GAAAGCCACA GGACACGGAG GAGCCAGTCC TGAGTTGGGT 

ttgtcgcagc ttcccatgcc agctgccttc cttgagactg gaaagggcct CTAGCACCCC 
0 tggggccatt caattcaggc ccaggcgccc aacctcagtt gttcacattc cccatgtgat 

CTCCTGTTGC TGCTTCACCT TGGGACTGTC TCGGCTTTGG TGACCTTGTA GGAAACTGGA 

ACCCCAGCAC cattgtttgg ctcctggaag ccttggggag aggaatttcc cacagggcag 

GGCCTGGGTC CTGATTCCCT GCCTCTTTAC TCCCTATTCA TCCCGGCTAC ACCCTTGGGC 
CCCCATCCTT GCTTGGCTCC AGTACTGGCT GGCACAGCTG TTGTGGTCAT CCAGGGATGG 
, 0 CAGGGCACTG GGGAACAGAA GAGAGAGGTC ACACAGTGCG GAACTGGGAG CAGGAGCTAG 

GACAAGGAAG GCTGGACTTG GGCCATGGAT TCCCTTCCTG CAGACTTGGG AAGTGAGCAC 

acttgagtga ttagagaagg tgtcttcgtt CTAAGGGCAG tggaggaggc accattttgg 
35 agcctgcatc attcgtattt gggctagatt gaaaaataga gctttctaag tcctctgcag 

agaatgggag gctctcacaa ctgggagaag tattggctct tttcctgaga attttgccaa 
gggtatgctg ttactggggc tggtttggaa ggagtatagg gcattatgtc tgtgaaggca 

40 

GTGGCTGGGG TGGGGCCTTA TCAGGCCCAA GGAOCATCTG OCCACATCTC AGAGTCCACA 
GATGAGGATC ACGGATGTGT AGAGGAAACA TCCTAGGCAG GCAATCATCT GACTGCTTTT 
45 TTGGGGCAGG TGATGCCCTG GGAAATTGGG AGGGAGGGAG AGAGGGAGGT AGGCTATTCT 

AGAAACTGGG AGAGCAGGTG AGGTAGGATT GGGAGGACCA GGGGTCAGGG TCCCCATTGG 
TCCCTAATTG AGAACGGAGA GAGCATTGGT CTAGGAGGCA GGCAGCTCGG TTATAAGACC 

50 ttgggaactc TTGATTTAGA atccaagatc ctttttagat ctaggatttt ataaaattaa 

GATATCCCCT AAGATCAAAT GCAACGTGGA GTCCTGAATT GGATCCTAGA ACAGAAGAAG 
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GACATTTGTG GAAAAACTAG TGAAATCCAA ATAAAGTCTG TAGTTTTGTT AATAGTAATG 
CACCAATGTC AGTTGCCTAG TTGTGACAAA TATACCGTGG TTATGTAAGA TGGTAACATT 
AGGGGGAACT GGAGAAGGGT AGATTGGAGC TCTCTGTACT ATCTTTGCAA CTTTTCTGGG 
AATCTAAAAT TACTCCAAAA TAAAAAAAAA ATGTATTTAA AGTAAATATA TTCCCTAAGA 
10 GTCCAGGAGG CAGGGGAGTT GTAGAAGCAG CTGAGTGOTT GGGTTCTGAC AGATTTGGTT 

CCAACTCGGT CTCTGCTGCT CACCAGCTGT GTQACCTTGA GCAAGTGGCT TAGCCTTTCT 

gagcctgatt tccttatctg tggagtgggg aagatgacag ccacctcgca gggctgtgga 
» gggttaaacg aggtgatgca tggacagcag ccgcactgac cttgctggtg tggggctcct 

GCTTCTGTTC TTCCCGTGCA GCCTTGGGAA TGTTGGAGGC CGTATCCAGG GACCCCTGGG 
CCTCCTGGGA TGGCCTCTCT GGATCAGCCT TGGAAGGTTC CAGGCTGCCC TTAGGCTCCC 

20 

ACATTCTTCC CCAGTCACGC TCTCCTCGCC CTGCCCACAC CAGTCCTGTG ACCCTTGCCT 
gagttgtgac ttcccacccc tccccggcct agaggaaagc tgcctggccc CTCAGTGGGA 

25 CTCCCGCCCA CTGACCCTCT GTCCACCATA CACAGACAGG GGCACTATCC ACAAGGTGGT 

ggaaccgggg gagcaggagc acagcttcgc cttcaacatc atggagatcc agcccttccg 

CCGCGCGGCT GCCATCCAGA CCATGTCGCT GGATGCTGAG CGGGTGAGCC TTCCCCCACT 

30 gcgtcccatg ggctatgcag tgactgcagc tgaggacagg gctcctttgc atgtgatttg 

TGTGTTCTTT TAAGAGCTTC TAGGCCTTAG GGCCTGGACA TTTAGGACTG AGTGTGGGGT 

ggggcccggg cctgacccaa tcctgctgtc cttccagagg AAGCTGTATG tgagctccca 

35 

GTGGGAGGTG agccaggtgc ccctggacct gtgtgaggtc tatggcgggg gctgccacgg 
ttgcctcatg tcccgagacc cctactgcgg ctgggaccag ggccgctgca tctccatcta 
40 cagctccgaa cggtacgttg gccgggatcc ctccgtccct gggacaaggt gggcatggga 

cagggggagg tgttgtcggg ctggaagagg tggcggtact gggcctttct tgtgggacct 
cctctctact ggaactgcac taggggtaag gatatgaggg tcaggtctgc agccttgtat 

45 CTGCTGATCC TCTTTCGTCC TTCCCACTCC AGGTCAGTGC TGCAATCCAT TAATCCAGCC 

gagccacaca aggagtgtcc caaccccaaa ccaggtacct gatctggccc tgctggcggc 

tgtggcccaa tgagtggggt actgccctgc CCTGATTGTC CTGGTCTGAG ggaaacatgg 
50 

CCTTGTCCTG TGGGCCCCAG GTACATGGGG CAGGATACAG TCCTGCAGAG GGAGCCCTCT 
55 
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TGGTGGGATG AGCGAGACGG GAGAAAAAAG GAGGACGCTG AGGGCTGGGT TCCCCACGTT 
CATTCAGAAG CCTTGTCCTG GGATCCCAGT CGGTGGGGAG GACACATCCT CCCCTGGGAG 
CTCTTTGTCC CTCCTCACGG CTGCTTCCCC ACTGCCTCCC CAGACAAGGC CCCACTGCAG 
AAGGTTTCCC TGGCCCCAAA CTCTCGCTAC TACCTGAGCT GCCCCATGGA ATCCCGCCAC 
GCCACCTACT CATGGCGCCA CAAGGAGAAC GTGGAG CAGA GCTGCGAACC TGGTCACCAG 

agccccaact gcatcctgtt cat cgag aac ctcacggcgc AGCAGTACGG ccactacttc 

TGCGAGGCCC AGGAGGGCTC CTACTTCCGC GAGGCTCAGC ACTGGCAGCT GCTGCCCGAG 
, 5 gacggcatca tggccgagca CCTGCTGGGT catgcctgtg CCCTGGCCGC ctccctctgg 

ctgggggtgc tgcccacact cactcttggc ttgctggtcc actagggcct cccoaggctg 

GGCATGCCTC AGGCTTCTGC AGCCCAGGGC ACTAGAACGT CTCACACTCA GAGCCGGCTG 
20 GCCCGGGAGC tccttgcctg ccacttcttc CAGGGGACAG aataacccag TGGAGGATGC 

CAGGCCTGGA GACGTCCAGC CGCAGGCGGC TGCTGGGCCC CAGGTGGCGC ACGGATGGTG 

aggggctgag AATGAGGGCA ccgactgtga AGCTGGGGCA tcgatgaccc aagactttat 
CTTCTGGAAA ATATTTTTCA GACTCCTCAA ACTTGACTAA ATGCAGCGAT GCTCCCAGCC 
CAAGAGCCCA TGGGTCGGGG AGTGGGTTTG GATAGGAGAG CTGGGACTCC ATCTCOACCC 
30 TGGGGCTGAG GCCTGAGTCC TTCTGGACTC TTGGTACCCA CATTGCCTCC TTCCCCTCCC 

TCTCTCATGG CTGGGTGGCT GGTGTTCCTG AAGACCCAGG GCTACCCTCT GTCCAGCCCT 
GTCCTCTGCA GCTCCCTCTC TGGTCCTGGG TC CCACAGGA CJkGCCGCCTT GCATGTTTAT 
35 TGAAGGATGT TTGCTTTCCG GACGGAAGGA CGGAAAAAGC TCTGAAAAAA AAAAAAAAAA 

AAAAAAAA 



(2) ANGABEN ZU SEQ ID NO: 42: 





U) 


SEQTJENZKENNZEICHEN : 






(A) LANGE: 6622 Baaenpaare 


46 




(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE; linear 




(ii) 


ART DBS MOLEKULS : Genom-DNA 


50 


(ix) 


MERKMAL: 



(A) NAME/SCHLUSSEL: exon 

(B) LAGE:1. - 6622 
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(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 42: 








GATATCATGG 


AGATAATTAA 


AATGATAACC 


ATCTCGCAAA 


TAAATAAGTA 


TTTTACTGTT 


60 


TTCGTAACAG 


TTTTGTAATA 


AAAAAACCTA 


TAAATATGAA 


ATTCTTAGTC 


AACGTTGCCC 


120 


TTGTTTTTAT 


GGTCGTATAC 


ATTTCTTACA 


TCTATGCGGA 


TCGATGGGGA 


TCCGCCCAGG 


180 


GCCACCTAAG 


GAGCGGACCC 


CGCATCTTCG 


CCGTCTGGAA 


AGGCCATGTA 


GGGCAGGACC 


240 


GGGTGGACTT 


TGG CCAGACT 


GAGCCGCACA 


CGGTGCTTTT 


CCACGAGCCA 


GGCAGCTCCT 


300 


CTGTGTGGGT 


GGGAGGACGT 


GGCAAGGTCT 


AC CTCTTTGA 


CTTCCCCGAG 


GGCAAGAACG 


360 


CATCTGTGCG 


CACGGTGAAT 


ATCGGCTCCA 


CAAAGGGGTC 


CTGTC TGG AT 


AAGCGGGACT 


420 


GCGAGAACTA 


CATCACTCTC 


CTGGAGAGGC 


GGAGTGAGGG 


GCTGCTGGCC 


TGTGGCACCA 


480 


ACGCCCGGCA 


CCCCAGCTGC 


TGGAACCTGG 


TGAATGGCAC 


TGTGGTGCCA 


C TTGGCGAGA 


540 


TGAGAGGCTA 


TGCCCCCTTC 


AGCCCGGACG 


AGAACTCCCT 


GGTTCTGTTT 


GAAGGGGACG 


600 


AGGTGTATTC 


CAC CATCCGG 


AAGCAGGAAT 


ACAATGGGAA 


GATCCCTCGG 


TTC CGCCGCA 


660 


TCCGGGGCGA 


GAGTGAGCTG 


TACACCAGTG 


ATACTGTCAT 


GCAGAACCCA 


CAGTTCATCA 


72 0 


AAGCCACCAT 


CGTGCACCAA 


GACCAGGCTT 


ACGATGACAA 


GATCTACTAC 


TTCTTCCGAG 


780 


AGGACAATCC 


TGACAAGAAT 


CCTGAGGCTC 


CTCTCAATGT 


GTCCCGTGTG 


GCCCAGTTGT 


840 


GCAGGGGGGA 


CCAGGGTGGG 


GAAAGTTCAC 


TGTCAGTCTC 


CAAGTGGAAC 


ACTTTTCTGA 


900 


AAGCCATGCT 


GGTATGCAGT 


GATGCTGCCA 


CCAACAAGAA 


CTTCAACAGG 


CTGCAAGACG 


960 


TCTTCCTGCT 


CCCTGACCCC 


AGCGGCCAGT 


GGAGGGACAC 


CAGGGTCTAT 


GGTGTTTTCT 


1020 


CCAACCCCTG 


GAACTACTCA 


GCCGTCTGTG 


TGTATTCCCT 


CGGTGACATT 


GACAAGGTCT 


1080 


TCCGTACCTC 


CTCACTCAAG 


GGCTACCACT 


CAAGCCTTCC 


CAACCCGCGG 


CCTGGCAAGT 


1140 


GCCTCCCAGA 


CCAGCAGCCG 


ATAC CCACAG 


AGACCTTCCA 


GGTGGCTGAC 


CGTCACCCAG 


1200 


AGGTGGCGCA 


GAGGGTGGAG 


CCCATGGGGC 


CTCTGAAGAC 


GCCATTGTTC 


CACTCTAAAT 


1260 


ACCACTACCA 


GAAAGTGGCC 


GTTCACCGCA 


TGCAAGCCAG 


CCACGGGGAG 


ACCTTTCATG 


1320 


TGCTTTACCT 


AACTACAGAC 


AGGGGCACTA 


TC CACAAGGT 


GGTGGAACCG 


GGGGAGCAGG 


1380 


AGCACAGCTT 


CGCCTTCAAC 


AT C ATGGAG A 


TCCAGCCCTT 


CCGCCGCGCG 


GCTGCCATCC 


1440 


AGACCATGTC 


GCTGGATGCT 


GAGCGGAGGA 


AG CTGTATGT 


GAGCTCCCAG 


TGGGAGGTGA 


1500 


GCCAGGTGCC 


CCTGGACCTG 


TGTGAGGTCT 


ATGGCGGGGG 


CTGCCACGGT 


TGCCTCATGT 


1560 
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CCCGAGACCC CTACTGCGGC 
GGTCAGTGCT GCAATCCATT 
CAGACAAGGC CCCACTGCAG 
GCCCCATGGA ATCCCGCCAC 
GCTGCGAACC TGGTCAC CAG 
AGCAGTACGG CCACTACTTC 
ACTGGCAGCT GCTGCCCGAG 
CCCTGGCTGC CTGAATTCGA 
TGAAGTTTCC CTGGTGTTCA 
TCCGGCGTAT TAAAACACGA 
GCGTTGTTGA TTTACAGACA 
TTTAGGGTGG TATGTTAGAG 
AAATATTAAA TCCTCAATAG 
TTTT TCCGAA CCGATGGCTG 
CAAATCTTGT AGCAGCAATC 
AGGTTCGACG TCGTTCAAAA 
GTACAATTGA CTCGACGTAA 
GTTAGCTTTA TTAGGCCGAT 
CGAAGACGAT TTTGCCATAG 
GATCAAATTT GTAGTTGAGC 
TTTCAATCTA ACTGTGCCCG 
CGGTGGTAAC ATTTCAGACG 
ATCTACCATC GGTGGAGGCG 
CGGTGATGCA GACGGCGGTT 
TCAACTATTG TACTGGTTTC 
GCATAGTTAA GCCAGCCCCG 
CTGCTCCCGG CATCCGCTTA 



TGGGACCAGG GCCGCTGCAT 

aatccagccg agccacacaa 

AAGGTTTCCC TGGCCCCAAA 
GCCACCTACT CATGGCGCCA 
AGCCCCAACT GCATCCTGTT 
TGCGAGGCCC AGGAGGGCTC 
GACGGCATCA TGGCCGAGCA 
AGCTTGGAGT CGACTCTGCT 
AAGTAAAGGA GTTTGCACCA 
TACATTGTTA TTAGTACATT 
ATTGTTGTAC GTATTTTAAT 
CGAAAATCAA ATGATTTTCA 
ATTTGTAAAA TAGGTTTCGA 

gactatctaa tggattttcg 

TAGCTTTGTC GATATTCGTT 
TATTATGCGC TTTTGTATTT 
ACACGTTAAA TAAAGCCTGG 
TATCGTCGTC GTCCCAACCC 
CCACACGACG CCTATTAATT 
TTTTTGGAAT TATTTCTGAT 
ATTTTAATTC AGACAACACG 
GCAAATCTAC TAATGGCGGC 
CAGGCGGGGC TGGCGGCGGA 
TAGGCTCAAA TTGTCTCTTT 
GGGCGTATGG TGCACTCTCA 
ACACCCGCCA ACACCCGCTG 
CAGACAAGCT GTGACCGTCT 



CTCCATCTAC AGCTCCGAAC 
GGAGTGTCCC AACCCCAAAC 
CTCTCGCTAC TACCTGAGCT 
CAAGGAGAAC GTGGAGCAGA 
CATCGAGAAC CTCACGGCGC 
CTACTTCCGC GAGGCTCAGC 
CCTGCTGGGT CATGCCTGTG 
GAAGAGGAGG AAATTCTCCT 
GACGCACCTC TGTTCACTGG 
TATTAAGCGC TAGATTCTGT 
AATTCATTAA ATTTATAATC 
GCGTCTTTAT ATCTGAATTT 
TTAGTTTCAA ACAAGGGTTG 
CTCAACGCCA CAAAACTTGC 
TGTGTTTTGT TTTGTAATAA 
CTTTCATCAC TGTCGTTAGT 
ACATATTTAA CATCGGGCGT 
TCGTCGTTAG AAGTTGCTTC 
GTGTCGGCTA ACACGTCCGC 
TGCGGGCGTT TTTGGGCGGG 
TTAGAAAGCG ATGGTGCAGG 
GGTGGTGGAG CTGATGATAA 
GGCGGAGGCG GAGGTGGTGG 
CAGGCAACAC AGTCGGCACC 
GTACAATCTG CTCTGATGCC 
ACGCGCCCTG ACGGGCTTGT 
CCGGGAGCTG CATGTGTCAG 
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AGGTTTTCAC CGTCATCACC GAAACGCGCG 
TTATAGGTTA ATGTCATGAT AATAATGGTT 
AATGTGCGCG GAACCCCTAT TTGTTTATTT 
ATGAGACAAT AACCCTGATA AATGCTTCAA 
CAACATTTCC GTGTCGCCCT TATTCCCTTT 
CAC CCAGAAA CGCTGGTGAA AGTAAAAGAT 
TACATCGAAC TGGATCTCAA CAGCGGTAAG 
TTTCCAATGA TGAGCACTTT TAAAGTTCTG 
GCCGGGCAAG AGCAACTCGG TCGCCGCATA 
TCACCAGTCA CAGAAAAGCA TCTTACGGAT 
GCCATAACCA TGAGTGATAA CACTGCGGCC 
AAGGAGCTAA CCGCTTTTTT GCACAACATG 
GAACCGGAGC TGAATGAAGC CATACCAAAC 
ATGGCAACAA CGTTGCGCAA ACTATTAACT 
CAATTAATAG ACTGGATGGA GGCGGATAAA 
CCGGCTGGCT GGTTTATTGC TGATAAATCT 
ATTGCAGCAC TGGGGCCAGA TGGTAAGCCC 
AGTCAGGCAA CTATGGATGA ACGAAATAGA 
AAGCATTGGT AACTGTCAGA CCAAGTTTAC 
CATTTTTAAT TTAAAAGGAT CTAGGTGAAG 
CCTTAACGTG AGTTTTCGTT CCACTGAGCG 
TCTTGAGATC CTTTTTTTCT GCGCGTAATC 
CCAGCGGTGG TTTGTTTGCC GGATCAAGAG 
TTCAGCAGAG CGCAGATACC AAATACTGTT 
TTCAAGAACT CTGTAGCACC GCCTACATAC 
GCTGCCAGTG GCGATAAGTC GTGTCTTACC 
AAGGCGCAGC GGTCGGGCTG AACGGGGGGT 
ACCTACACCG AACTGAGATA CCTACAGCGT 



AGACGAAAGG GCCTCGTGAT ACGCCTATTT 
TCTTAGACGT CAGGTGGCAC TTTTCGGGGA 
TTCTAAATAC ATTCAAATAT GTATCCGCTC 
TAATATTGAA AAAGGAAGAG TATGAGTATT 
TTTGCGGCAT TTTGCCTTCC TGTTTTTGCT 
GCTGAAGATC AGTTGGGTGC ACGAGTGGGT 
ATCCTTGAGA GTTTTCGCCC CGAAGAACGT 
CTATGTGGCG CGGTATTATC CCGTATTGAC 
CACTATTCTC AGAATGACTT GGTTGAGTAC 
GGCATGACAG TAAGAOAATT ATGCAGTGCT 
AACTTACTTO TGACAACGAT CGGAGGACCG 
GGGGATCATG TAACTCGCCT TGATCGTTGG 
GACGAGCGTG ACACCACGAT GCCTGTAGCA 
GGCGAACTAC TTACTCTAGC TTCCCGGCAA 
GTTGCAGGAC CACTTCTGCG CTCGGCCCTT 
GGAGCCGGTG AGCGTGGGTC TCGCGGTATC 
TCCCGTATCG TAGTTATCTA CACGAC GGGG 
CAGATCGCTG AGATAGGTGC CTCACTGATT 
T CAT AT AT AC TTTAGATTGA TTTAAAACTT 
ATCCTTTTTG ATAATCTCAT GACCAAAATC 
TCAGACCCCG TAGAAAAGAT CAAAGGATCT 
tgctgcttgc AAACAAAAAA ACCACCGCTA 
CTACCAACTC TTTTTCCGAA GGTAACTGGC 
cttctagtgt AGCCGTAGTT AGGCCACCAC 
CTCGCTCTGC taatcctgtt ACCAGTGGCT 
GGGTTGGACT CAAGACGATA GTTACCGGAT 
TCGTGCACAC AGCCCAGCTT GGAGCGAACG 
GAGCTATGAG AAAGCGCCAC GCTTCCCGAA 
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GGGAGAAAGG CGGACAGGTA 
GAGCTTCCAG GGGGAAACGC 
CTTGAGCGTC GATTTTTGTG 
AACGCGGCCT TTTTACGGTT 
GCGTTATC CC CTGATTCTGT 
CGCCGCAGCC GAACGACCGA 
GTCTGCTCAT CCATGACCTG 
ATCAGCAACG GCTTGCCGTT 
CCGACATCGC AGGCTTCTGC 
GCACGATAGA GATTCGGGAT 
AGTGTGACGC GATCGGTATA 
GTGCCGCTGG CGACCTGCGT 
CGCAACTCGC CGCACATCTG 
AAGCGAGTGG CAACATGGAA 
TCACGGAAAA TGCCGCTCAT 
CAACGCAGCA CCATCACCGC 
AATTCAGACG GCAAACGACT 
TGAAACGCCG AGTTAACGCC 
TCATCAACAT TAAATGTGAG 
GGATTGACCG TAATGGGATA 
TGCCAGTTTG AGGGGACGAC 
TCCGGCACCG CTTCTGGTGC 
AACTGTTGGG AAGGGCGATC 
GGATGTGCTG CAAGGCGATT 
AAAACGACGG GATCTATCAT 
CTAATTTTAC GACGACGATG 
CAAGCGTTAT CAATTTTTCA 



TCCGGTAAGC GGCAGGGTCG 
CTGGTATCTT TATAGTCCTG 
ATGCTCGTCA GGGGGGCGGA 
CCTGGCCTTT TGCTGGCCTT 
GGATAACCGT ATTACCGCCT 
GCGCAGCGAG TCAGTGAGCG 
ACCATGCAGA GGATGATGCT 
CAGCAGCAGC AGACCATTTT 
TTCAATCAGC GTGCCGTCGG 
TTCGGCGCTC CACAGTTTCG 
ACCACCACGC TCATCGATAA 
TTCACCCTGC CATAAAGAAA 
AACTTCAGCC TCCAGTACA G 
ATCGCTGATT TGTGTAGTCG 
CCGCCACATA TCCTGATCTT 
GAGGCGGTTT TCTCCGGCGC 
GTCCTGGCCG TAACCGACCC 
ATCAAAAATA ATTCGCGTCT 
CGAGTAACAA CCCGTCGGAT 
GGTCACGTTG GTGTAGATGG 
GACAGTATCG GCCTCAGGAA 
CGGAAACCAG GCAAAGCGCC 
GGTGCGGGCC TCTTCGCTAT 
AAGTTGGGTA ACGC CAGGGT 
TTTTAGCAGT GATTCTAATT 
CGAGCTTTTA TTCAACCGAG 
TTATCGTATT GTTGCACATC 



GAACAGGAGA GCGCACGAGG 
TCGGGTTTCG CCACCTCTGA 
GCCTATGGAA AAACGCCAGC 
TTGCTCACAT GTTCTTTCCT 
TTGAGTGAGC TGATACCGCT 
AGGAAGCATC CTGCACCATC 
CGTGACGGTT AACGCCTCGA 
CAATCCGCAC CTCGCGGAAA 
CGGTGTGCAG TTCAACCACC 
GGTTTTCGAC GTTCAGACGT 
TTTCACCGCC GAAAGGCGCG 
CTGTTACCCG TAGGTAGTCA 
CGCGGCTGAA ATCATCATTA 
GTTTATGCAG CAACGAGACG 
CCAGATAACT GCCGTCACTC 
GTAAAAATGC GCTCAGGTCA 
AGCGCCCGTT GCACCACAGA 
GGCCTTCCTG TAGCCAGCTT 
TCTCCGTGGG AACAAACGGC 
GCGCATCGTA ACCGTGCATC 
GATCGCACTC CAGCCAGCTT 
ATTCGCCATT CAGGCTGCGC 
TACGCCAGCT GGCGAAAGGG 
TTTCCCAGTC ACGACGTTGT 
GCAGCTGCTC TTTGATACAA 
CGTGCATGTT TGCAATCGTG 
AACAGGCTGG AGACCACGTT 
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GAACTCGCCG CAGTTTTGCG GCAAGTTGGA CCCGCCGCGC ATCCAATGCA AACTTTCCGA 
CATTCTGTTG CCTACGAACG ATTGATTCTT TGTCCATTGA TCGAAGCGAG TGCCTTCGAC 
TTTTTCGTGT CCAGTGTGGC TT 
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(2) ANGABEN ZU SEQ ID NO: 43: 

(1) SEQUENZKENNZEICHEN: 

(A) LANGE: 31 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE; linear 

<ii) ART DES MOLEKOlS : Genom-DNA 



(ix) MERKMAL: 

(A) NAMB/SCHLOSSEL: exon 
<B) LAGE:1. .31 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 43: 
CCGGATCCGC CCAGGGCCAC CTAAGGAGCG G 



(2) ANGABEN ZU SEQ ID NO: 44: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 29 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Genom-DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 44: 
CTGAATTCAG GAGCCAGGG C ACAGGCATG 
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Patentanspruche 

1. Semaphorin enthaltend eine charakteristische Sema-Domane, dadurch gekennzeichnet. daB das Protein ein N- 
terminales Signalpeptid und im C-terminalen Bereich eine Immunglobulin-Shnliche Domane und eine Transmem- 
brandomane autweist, wobei das Semaphorin als Semaphorin vom Typ L (SemaL) bezeichnet wird und Derivate 
des Semaphorins vom Typ L 

2. Semaphorin nach Anspruch 1 . wobei das Protein (humanes Semaphorin vom Typ L (H-SemaL)) die Aminosaure- 
sequenz SEQ ID NO. 3 hat. 
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3. Semaphorin nach einem Oder mehreren der Anspruche 1 und 2, wobei das Protein im Bereich der Sema-Domane 
eine Aminosdureiderrtitat von mindestens 40 % im Bezug auf die Sema-Domane von H-SemaL autweist. 

4. Semaphorin nach einem oder mehreren der Anspruche 1 bis 2, wobei das Protein die partielle Aminosaurese- 

5 quenz SEQ ID NO. 4 enthait (murines Semaphorin (M-SemaL)). 

5. Nukleinsaure enthaltend eine Nukleinsaure-Sequenz, die fur ein Semaphorin vom Typ L gemafi einem Oder meh- 
reren der AnsprOche 1 bis 4 kodiert sowie Derivate derselben. 

io 6. Nukleinsaure nach Anspruch 5, wobei besagte Nukleinsaure-Sequenz ein Semaphorin L Gen ist 

7. Nukleinsaure nach einem Oder mehreren der Anspruche 5 und 6, wobei besagte Nukleinsaure-Sequenz das Gen 
von H-SemaL enthait 

is 8. Nukleinsaure nach Anspruch 5, wobei besagte Nukleinsaure-Sequenz die cDNA eines Semaphorins vom Typ L 
enthait. 

9. Nukleinsaure nach Anspruch 8, wobei die cDNA die cDNA von H-SemaL ist. 

20 10. Nukleinsaure nach Anspruch 8, wobei die cDNA die cDNA von M-SemaL ist. 

11. Verfahren zur Herstellung eines Semaphorins vom Typ L gemafi einem Oder mehreren der Anspruche 1 bis 4, 
dadurch gekennzeichnet, da8 eine Nukleinsaure-Sequenz, die fur ein Semaphorin vom Typ L oder ein Denvat der- 
selben kodiert in einen Expressionsvektor Honiert und exprimiert wird. 

25 

12. Verfahren gemaB Anspruch 1 1 . wobei fur die Expression eine eukaryotische Zelle verwendet wird. 

13. Verwendung eines Semaphorins vom Typ L oder eines Derivats desselben oder einer Nukleinsaure-Sequenz, die 
* fur ein Semaphorin vom Typ L kodiert oder eines Derivats derselben zur Herstellung eines Arzneimittels, das zur 

30 Behandlung oder Pravention von immunologischen Erkrankungen verwendet werden kann. 

14. Verwendung einer Nukleinsaure-Sequenz oder eines Derivats derselben nach Anspruch 13 in der Gentherapie. 

15. Verwendung eines Semaphorins vom Typ L oder einer Nukleinsaure-Sequenz, die fur ein Semaphorin vom Typ L 

35 kodiert in einem Verfahren zur Identifizierung von immunmodulierenden Wirkstoffen. 

16. Verfahren zur Identifizierung von immunmodulierenden Wirkstoffen, dadurch gekennzeichnet, daB ein Semaphorin 
vom Typ Lunterdefinierten Bedingungen mit einem zu untersuchenden Wirkstoff inkubiert wird, parallel ein zweiter 
Ansatz ohne den zu untersuchenden Wirkstoff, aber unter ansonsten gleichen Bedingungen durchgefOhrt wird und 

40 dann die inhibierende bzw. aktivierende Wirkung des zu untersuchenden Wirkstoffs bestimmt wird. 

17. Verfahren zur identifizierung von immunmodulierenden Wirkstoffen, dadurch gekennzeichnet, daB eine Nuklein- 
saure-Sequenz, die fur ein Semaphorin vom Typ L kodiert unter definierten Bedingungen und in Gegenwart eines 
zu untersuchenden Wirkstoffs exprimiert wird und das AusmaB der Expression bestimmt wird. 

45 

18. Verfahren zur Herstellung einer Nukleinsaure, die fur ein Semaphorin vom Typ L kodiert, wobei diese Nukleinsaure 
' m it Hilfe der Polymerase Ketten Reaktion unter Verwendung von spezifischen Primern amplifiziert wird. 

19. Semaphorin Antikdrper, dadurch gekennzeichnet, daB er entweder das Ep'rtop von H-SemaL, das den Aminosau- 

50 ren 1 79-378 in SED ID NO: 4 entspricht, erkennt Oder daB er das Eprtop von H-SemaL, das den Aminosauren 480- 

666 in SED ID NO: 4 entspricht, erkennt. 

20. Verfahren zur Herstellung eines Semaphorin Antikbrpers nach Anspruch 19, wobei die Epitope als Fusionsproteine 
mit einem Epitop-Tag exprimiert und uber dieses Epitop-Tag aufgereinigt werden und die aufgereinigten Fusions- 

55 protein e zur immunisierung verwendet werden. 
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(54) Humanes und murines Semaphorin L 

(57) Humanes Semaphorin L(H-SemaL) und korre- 
spondierende Semaphorine in anderen Spezies. 

Gegenstand der Erfindung sind neuen Semapho- 
rine, die sich durch eine besondere Domanenstruktur 
auszeichnen und deren Derivate, NuWeinsauren (DNA, 
RNA, cDNA), die fur dies© Semaphorine kodieren und 
deren Derivate sowie die Verwendung derselben. 

Gegenstand der vorliegenden Erfindung sind Sem- 
aphorine mit einer neuen, bisher nicht bekannten und 
nicht zu erwartenden Domanenstruktur, denen eine bio- 
chemische Funktion im Immunsystem zukommt 
(immunmodulierende Semaphorine). Die erfindungs- 
gemaBen Semaphorine werden als Semaphorine vom 
Typ L (SemaL) bezeichnet. Sie enthalten ein N-termina- 
les Signalpeptid, eine charakteristische Sema-Domane 
und im C-terminalen Bereich des Proteins eine Immun- 
globulin-ahnliche Domane und eine hydrophobe 
Domane, die eine potentielle Transmembrandomane 
darstellt. 



Printed by Xerox (UK) Business Servioes 
2 . 16 . 7 / 3.6 




EPO FORM 1503 03.R2 (P04C03) 



EP 0 892 047 A3 




Europ3isches 

Patentamt 



EUROPAISCHER RECHERCHENBERICHT 



Nummor dor Anmeldung 

EP 98 11 2470 



EINSCHLAGIGE DOKUMENTE 



Kategoria 



D, X 



D, A 



Kennzeichnung des Dokuments mit Angabe, soweit erforderlich, 
der maf3geblichen Teiie 



ENSSER A ET AL: "Alcephallne herpesvirus 

type 1 has a semaphorin-like gene" 

JOURNAL OF GENERAL VIROLOGY., 

Bd. 76, 1995, Seiten 1063-1067, 

XP002113888 

SOCIETY FOR GENERAL MICROBIOLOGY, 

READING., GB 
ISSN: 0022-1317 

* Abbildung 2 * 

DATABASE EMBL ‘Online! 

Accession Number H03806, 

22. Juni 1995 (1995-06-22) 

HILL1ER L ET AL: "yj39f01.rl Homo sapiens 
cDNA clone 151129 5’ similar to SP:A49069 
A49069 COLLAPSIN - 
XP002125533 

* 94% identitat (420 BP) zwlschen SEQ ID 1 
und H03806 * 

DATABASE EMBL ‘Online! 
accession number AA260340, 

19. MSrz 1997 (1997-03-19) 

MARRA M ET AL: n va91b02.rl Soares mouse 
3NME12 5 Mus musculus cDNA clone 746763 5 
similar to TR:G1000717 G1000717 SIMILAR TO 
GENBANK ACCESSION NUMBER L26081 . 
XP002125534 . w Tn 

* 99.7% identitat (347 BP) zwischen SEQ ID 
1 und H03806 * 



,3,5,6 

8,11 



Betrifft 

Anspruch 



KLASSIF1KATION DER 
ANMELDUNG (lnt.Ct.6) 



C12N15/12 
C07K 14/47 
A61K48/00 
G01N33/50 



recherchierte 

SACHGEBIETE (lnt.Cl.6) 



C12N 

C07K 

A61K 

G01N 
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Der v 


orllegende Recherche nbericht wurde fQr alle Patentanspruche erstellt 
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Ftocherctienort 

DEN HAAG 


AbscNuOdatum d*f Heoherche 

10. Januar 2000 


rmrer 

Lejeune, R 


kategorie der genannten do* 

X : von besonderar Bedeutung allein betract 
Y von besonderer Bedeutung in Verbindun 
anderen Verdffentflchung dersetoen Kate 
A : tecnnologischer Hirrtergrund 
O : nlchtschrtttUche Ottenbanjng 
P : Zwischenhtaralur 


i JMFNTP T : der Ertindung 2ugrunde liegende Theorien Oder Grundsatze 

E : aiierea Paientdokument, das Jedoch erst am Oder 
nach dem Anmeldedatum vortWentUcht wordon ist 
□ mit einer D : in der Anmeldung angefuhrtes Dokument 

l : aos anderen GrQnden angefuhrtes Dokument 

& : Mitglled dor gloichon Patentlarnille.ObereinstlmmerMles 
Dokument 
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6P0 FORM 1503 03.62 (P04C03) 



EP 0 892 047 A3 




Europalsches 

Patentamt 



EUROPAISCHER RECHERCHENBERICHT 



Hummer der Anmeldung 

EP 98 11 2470 



kategofia 



EINSCHLAGIGE DOKUMENTE 

Kennzeichnung des Dokuments mil Angabe, soweit erlorderlich, 
der maBqeblichen Teile 



Betrifft 

Anspmch 



T 



YAMAOA A ET AL: "Molecular cloning of a 

gl ycosyl phosphatl dyl 1 no si tol -anchored 
molecule CDwl08" 

JOURNAL OF IMMUNOLOGY. , 

Bd. 162, 1. April 1999 (1999-04-01), 
Seiten 4094-4100, XP002123609 
THE WILLIAMS AND WILKINS CO. BALTIMORE., 
US 



1-3, 5-9, 
11 , 12 , 
18-20 



KLASSIFIKATION DEB 
ANMELDUNG (lnlCI-6) 



ISSN: 0022-1767 

* 99.8% identitat zwischen SEQ ID 1 und 
CDW108 (Abblldung 1) * 

* Selte 4094, Spalte 2, Absatz 2 * 



T 



LANGE C ET AL: "New eukaryotic 

semaphorlns with close homology to 
semaphorins of viruses" 

GENOMICS, 

Bd. 51, 1. August 1998 (1998-08-01), 
Seiten 340-350, XP002U3887 
SAN DIEGO., US 
ISSN: 0888-7543 

* 99.8% identitat zwischen SEQ ID 1 und 
H-Sema-L (Abbildung 3) * 

-8, DATABASE EMBL ‘Online! 

Accession Number AF030699, 

8. September 1998 (1998-09-08) 

LANGE C ET AL: "Mus musculus semaphorln L 
(SemaL) mRNA, partial cds.” 

XP002125537 

* M-SemaL 1st Identlsch zu SEQ ID 1 * 



recherchierte 

SACHGEB1ETE (lnt-Cl-6) 
















Der v< 


xliegende Recherchenbericht wurde fur alle Patentanspruche erstellt 
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EPO FORM 1503 03.82 (P04C03) 



EP 0 892 047 A3 



Europaisches 

Patentamt 



EUROPAISCHER RECHERCHENBERICHT 



Nummer der Anmeldung 

EP 98 11 2470 



EINSCHLAGIGE DOKUMENTE 

Kannzslchnung des Dokuments mit Angabe, soweit erforderlich, Betrifft 

der maBoebiichen Tele Anspruch _ 

XU X ET AL: "Human semaphorin K1 Is 1-3, 5-9, 

glycosyl phosphatidyl lnosltol-1 inked and 11,12,18 
defines a new subfamily of viral-related 
semaphorlns" 

JOURNAL OF BIOLOGICAL CHEMISTRY., 

Bd. 273, Nr. 35, 

28. August 1998 (1998-08-28), Seiten 

22428-22434, XP002113886 

AMERICAN SOCIETY OF BIOLOGICAL CHEMISTS, 

BALTIMORE, MO., US 
ISSN: 0021-9258 

* 99.1% Identitat zwlschen SEQ 10 1 und 
Serna K1 (Abbildung 1) * 

WO 99 45114 A (ZYMOGENETICS INC) 1-3, 5-9, 

10. September 1999 (1999-09-10) 

18-20 

* 99.8% identltat zwischen SEQ ID 1 und 
SEQ ID 1 von W09945114) * 

* Bei spiel 4 * 

W0 99 38885 A (SMITHKLINE BEECHAM PLC) 1-3, 5-9,. 
5. August 1999 (1999-08-05) 11,12,18 

* 99.9% Identltat zwlschen SEQ ID 1 und 
SEQ ID 1 von W09938885 * 

WO 99 58676 A (SPRIGGS MELANIE K ;IMMUNEX 1-3, 5-9, 
CORP (US)) 18. November 1999 (1999-11-18) 11,12,18 

* 99.95% Identitat zwischen SEQ ID 1 und 

SEQ ID 1 von W09958676 * | 



KLASSIF1KATION DER 
ANMELOUNG (lnt.CI.6) 



1-3, 5-9, 
11 , 12 , 
18-20 



1-3, 5-9, L 
11,12,18] 



RECHERCHIERTE 
SACHGEBIETE (lnt.CI.6) 



Der vorliegende Recherchenbericht wurde fur alle Patentanspruche erstellt 



Atoscttuftdatum dec Recherche 



DEN HAAG | 

KATEGORIE OER GENANNTEN DOKUMENTE 

X : von besonderer Bedeutung allein betrachtet 
Y • von besonderer Bedeutung in Vertolndung mlt einer 
anderen Ver6ffentllchung derselben Kategorie 
A : tachnologischer Hintargrund 
O : nichtachriftliche Offenbarung 
P : Zwischenltteratur 



Januar 2000 



Lejeune, R 



T : dor Erfindung zugrunde liegende Theorien Oder Qrundsatza 
E : SBeres Patentdokument, das jedoch erst am Oder 
nach dam Anmeldedatum verdtfentliehl worden 1st 
D : In der Anmeldung angefUhrtos Dokument 
L : aus anderen Grunden angeluhrtes Dokument 

& : Mltglied der glelchen PatQntfamilie.iibaraimtimmendea 
Dokument 



4 



EP 0 892 047 A3 




Europaisches 

Patentamt 



EUROPAISCHER RECHERCHENBERICHT 



Nummer der Anmeldung 

EP 98 11 2470 



EINSCHLAGIGE DOKUMENTE 1 




Kategorie 


Kemzetchnung des Dokuments mit Angabe, sowelt erforderHch, 

der maSqeblichen Teile 


Betrlffl 

Anspruch 


KLASStFIKATtON DER 
ANMELDUNG (lnt.CI.6) 


T 

T 


DATABASE EM8L ‘Online! 

Accession Number AF 176670, 

7. September 1999 (1999-09-07) 

MINE T ET AL: "Mus musculus GPI-anchored 
membrane protein CDwl08 precursor (CDwl08) 
mRNA, complete cds." 

XP002125535 „ 

* 99,8% identitat zwlschen SEQ ID 2 und 
AF176670 * 

DATABASE EMBL ‘Online! 

Accession number ab017532, 

15. Marz 1999 (1999-03-15) 

TAKAHASHI H ET AL: “Mus musculus mRNA for 
msemKlp, complete cds.” 

XP002125536 

* 99.8% identitlt zwlschen SEQ ID 2 und 
AB017532 * 


1,3-6, 8, 
10-12,18 

1,3-6, 8, 
10-12,18 




recherchierte 

SACHGEBIETE (Int.CLS) 




Der v 


ortiegende Recherchenbericht wurde tur alle Patentanspriiche erstetlt 




Ractwn ^- n -^ — AbscHLrfldaium der Recherche 

> haag 10- Osnuar 2000 Lojeunc, R 


1 JIrernR \ ic opr GENANNTEN DOKUMENTE T : der Ertindung zugrunda liagende Thaonan Oder Grunds^Ua 

n KATEGORIE DER GENANN I tN t c £ . - Reres p at6 ntdokument, das jadoch erst am odar 

X : von beaonderer e.d.rfur* ;«««. „ * 

Y : U — and.™ Grund.n awNM- Dokum.nl 

| A : technologischof Hintergrund - ” — £ g j e j chan patenttamitie.uberelnstimmendM 

£ 0 : nichtschriftlicbe Ofte nbarung * ■ gi 

£ p : Zwfechenlitaratur 0 




EPO FORM P0461 



EP 0 892 047 A3 



ANHANG ZUM EUROPAISCHEN RECHERCHENBERICHT 
UBER DIE EUROPAISCHE PATENT ANMELDUNG NR. 



EP 98 11 2470 



in diesem Anhang sind die Milglieder der Patentfam.lien der im obengenannten europaischen Recherchenbericht angefQhrten 

enlsprechen den, Stand do, Datei des Europaischen Patentamts «n 
Diese Angaben dienen nur zur Unterrlchtung und erfolgen ohne GewAhr. 



im Recherchenbericht 
angetuhrtes Patentdokument 


Datum der 
VerOffentlichung 


Mitglied(er) der 
Patentfamilie 


Datum der 
Verfiffentlichung 


WO 9945114 


A 


10-09-1999 


AU 2982799 A 


20-09-1999 


WO 9938885 


A 


05-08-1999 


KEINE 




WO 9958676 


A 


18-11-1999 


KEINE 





Furnanere Einzelheiten zu diesem Anhang : siehe Amtsbtatt des Europaischen Patentamts.Nr.12/82 
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